Esst
Esst
Esst
el cuatro sólo aparece una vez (por lo tanto, tiene frecuencia f = 1),
Ejercicio 10
Los datos anotados representan los totales, en miles de pesos, gastados en
fotocopias por una muestra de 25 estudiantes durante un semestre.
29 89 77 72 39 47 64 84 88 57 28 63 38
42 36 72 69 68 41 52 39 84 45 52 72
Construya una tabla de frecuencias agrupadas usando la regla de Sturges.
Solución
Rango: R = Dato mayor – Dato menor = 89 – 28 = 61
Límites Frecuencia
Clases
reales absoluta (fi)
28 – 38 27,5-38,5 4
39 – 49 38,5-49,5 6
50 – 60 49,5-60,5 3
61- 71 60,5-71,5 4
72 – 82 71,5-82,5 4
83 – 93 82,5-93,5 4
• La marca de clase (Xi) es el punto medio de cada intervalo de clase
frontera inferior de clase + frontera superior de clase
𝑋𝑖 =
2
Clases: 𝑐 = 5
𝑅 22
Amplitud: 𝑤 = = = 4,4
𝑐 5
Construcción de la tabla de frecuencia
• Nuestra primera clase tendrá como límite inferior el dato menor y
luego los demás límites inferiores le sumaremos la amplitud.
Límites reales
Frecuencia Frec. acum
de clases
115,9-120,3 9 9
120,3-124,7 7 9+7=16
124,7-129,1 4 16+4=20
129,1-133,5 4 20+4=24
133,5-137,9 1 24+1=25
Solución utilizando la regla de Sturges
128 144 168 109 167 141 149 206 175 123
153 197 127 82 96 171 202 178 147 102
135 191 137 129 158 108 119 183 151 114
111 148 213 130 165 157 185 90 116 172
143 187 166 139 149 95 163 150 154 130
σ𝑵
𝒊=𝟏 𝒙𝒊
σ𝒏𝒊=𝟏 𝒙𝒊
𝝁= ഥ=
𝒙
𝑵 𝒏
σ𝑵 σ𝒏
𝒊=𝟏 𝒇𝒊 𝒙𝒊
𝒊=𝟏 𝒇𝒊 𝒙𝒊 ഥ=
𝒙
𝝁= 𝒏
𝑵
Mediana
Para datos medidos en al menos una escala de intervalo, la mediana es el
puntaje medio ordenado.
𝑥 𝑛+1 /2 , 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
𝑥 = ൞1
𝑥 + 𝑥𝑛 + 1 , 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2 𝑛/2 2
Moda
La moda, si se da, es el dato con mayor frecuencia.
Cuartiles.
Deciles.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Min D1 D2 D3 D4 D5 D6 D7 D8 D9 Max
Percentiles.
Una medida de centralización, casi nunca es suficiente por sí sola, para analizar
adecuadamente las características de un conjunto de datos. Por lo general,
necesitaremos, además, una medida de la dispersión o variación de los datos, entre las
que analizaremos se encuentran el rango o recorrido, el rango intercuartil, la desviación,
la varianza y la desviación estándar.
Varianza muestral
Rango Varianza poblacional 𝑛 2
𝑁 2 σ 𝑖=1 𝑥 𝑖 − 𝑥ҧ
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 2
σ𝑖=1 𝑥𝑖 − 𝜇 𝑠2 =
𝜎 = 𝑛−1
𝑁 𝑛
σ𝑖=1 𝑥𝑖 2 − 𝑛𝑥ҧ 2
Rango intercuartil: 𝑁
σ𝑖=1 𝑓𝑖 𝑥𝑖 − 𝜇 2 2
2 𝑠 =
𝑅. 𝐼 = 𝑄3 − 𝑄1 𝜎 = 𝑛−1
𝑁
σ𝑁
𝑖=1 𝑥𝑖
2
𝑛 2
Desviación 2
𝜎 = − 𝜇2 σ 𝑖=1 𝑓𝑖 𝑥 𝑖 − 𝑥ҧ
𝑁 𝑠2 =
𝐷𝑖 = 𝑥𝑖 − 𝑥ҧ 𝑁 2 𝑛−1
σ 𝑓 𝑥 𝑛 2
𝜎2 =
𝑖=1 𝑖 𝑖
− 𝜇2 2
σ 𝑖=1 𝑓𝑖 𝑥 𝑖 − 𝑛𝑥ҧ 2
𝑁 𝑠 =
Desviación media 𝑛−1
𝑛
σ𝑖=1 |𝑥𝑖 − 𝑥|ҧ Desviación estándar
𝐷𝑀 = Desviación estándar
𝑛 𝜎= 𝜎 2
𝑠 = 𝑠2
EJERCICIOS
45.La tabla siguiente contiene los salarios (en miles de pesos) de 30 trabajadores.
σ𝒏𝒊=𝟏 𝒙𝒊 𝑝𝑛
ഥ=
𝒙 𝑥 𝑛+1 /2 , 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 𝑖=
𝒏 100
𝑥 = ൞1
𝑥 + 𝑥𝑛/2 + 1 , 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
σ𝒏
𝒊=𝟏 𝒇𝒊 𝒙𝒊
2 𝑛/2
ഥ=
𝒙 𝒏
Varianza muestral
σ 𝑛 2
Rango 𝑖=1 𝑓𝑖 𝑥𝑖 − 𝑥ҧ Rango intercuartil:
𝑠2 =
𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 𝑛−1 𝑅. 𝐼 = 𝑄3 − 𝑄1
Desviación estándar
𝑠= 𝑠2
PROCEDIMIENTOS UTILIZANDO LA CALCULADORA
Medidas de formas
Simetría
Decimos que una distribución de frecuencias es simétrica cuando lo es su representación
gráfica, es decir, los datos equidistantes a una medida central de la misma tienen
frecuencias iguales. Esta medida central coincide con la mediana y la media.
Asimetría
Una distribución de frecuencias que no es simétrica, se denomina asimétrica. La asimetría se
puede presentar a la derecha ( asimetría positiva) o a la izquierda ( asimetría negativa) si la
representación grafica está más “estirada” hacia la derecha o hacia la izquierda,
respectivamente.
EJERCICIOS
49. La tabla siguiente da una muestra de los tiempos de recorrido (en minutos) de un camino
de 2,5 millas para el carro de Humberto y el de Greyci.
Encuentre el promedio de los tiempos de recorrido para cada uno de los carros.
(b) Calcule la varianza de los tiempos de recorrido para cada uno de los carros,
respectivamente.
(c) ¿Qué auto tuvo un desempeño más consistente, si la consistencia se mide con la varianza?
(d) Encuentre el coeficiente de variación para cada carro y comente al respecto.
1.4 Análisis de datos en tablas de frecuencias agrupadas
σ𝑛
𝑖=1 𝑓𝑖 𝑥𝑖 Varianza muestral
Media: 𝑥ҧ =
𝑛
𝑛 2
𝑛 2
σ𝑖=1 𝑓𝑖 𝑥𝑖 − 𝑥ҧ
−𝐹 𝑠 =
Mediana: 𝑥 = 𝐿𝑚𝑒𝑑 + 2
𝑤 𝑛−1
𝑓𝑚𝑒𝑑 𝑛 2 2
σ𝑖=1 𝑓𝑖 𝑥𝑖 − 𝑛 𝑥ҧ
𝑠2 =
𝑛−1
𝐷𝑎
Moda: 𝑀𝑜 = 𝐿𝑚𝑜𝑑 + 𝑤
𝐷𝑎 +𝐷𝑏
Desviación estándar
𝑝%∙𝑛−𝐹 𝑠= 𝑠2
p-ésimo punto percentil= 𝐿𝑝 + 𝑤
𝑓𝑝
DATOS AGRUPADOS
52.Se toma una muestra de 20 estudiantes. La tabla siguiente muestra la cantidad de tiempo
(en horas) empleado por cada uno de estos estudiantes de dicha muestra en preparar un
examen.
Tiempo de estudio (Horas) 0–3 3–6 6–9 9 – 12 12 - 15
Número de estudiantes 2 6 7 4 1
(a) Hallar las frecuencias relativas y las frecuencias relativas acumuladas.
(b) Estimar la media, la mediana, la moda y la desviación típica del tiempo de estudio.
σ𝑛
𝑖=1 𝑓𝑖 𝑥𝑖 Varianza muestral
Media: 𝑥ҧ =
𝑛
σ𝑛 2
𝑖=1 𝑓𝑖 𝑥 𝑖 − 𝑥ҧ
𝑛 𝑠2 =
2
−𝐹 𝑛−1
Mediana: 𝑥 = 𝐿𝑚𝑒𝑑 + 𝑤 σ𝑛
𝑓 𝑥 2
− 𝑛 𝑥ҧ 2
𝑓𝑚𝑒𝑑 𝑖=1 𝑖 𝑖
𝑠2 =
𝑛−1
𝐷𝑎
Moda: 𝑀𝑜 = 𝐿𝑚𝑜𝑑 + 𝑤
𝐷𝑎 +𝐷𝑏 Desviación estándar
𝑠= 𝑠2
𝑝%∙𝑛−𝐹
p-ésimo punto percentil= 𝐿𝑝 + 𝑤
𝑓𝑝
53. Durante una epidemia de gripe, los tiempos de espera en cierto centro de salud
fueron más largos de lo habitual. La siguiente tabla resume la distribución de los
tiempos de espera para una muestra de 24 pacientes que visitaron el centro de
salud durante este período.