1.3.3. Medidas de Tendencia Central Con Datos Agrupados
1.3.3. Medidas de Tendencia Central Con Datos Agrupados
1.3.3. Medidas de Tendencia Central Con Datos Agrupados
A continuación se dan las fórmulas para calcular la mediana, la moda y la media para
datos agrupados. Cabe aclarar que estas medidas pueden calcularse para poblaciones, en
cuyo caso se les llama parámetros, o también pueden calcularse para muestras, es decir
una parte de la población, en cuyo caso se llaman estadísticos. Debe establecerse la
diferencia acerca de cuándo se están calculando para muestras o para poblaciones
porque no tienen el mismo valor una vez que se calculan para uno u otro caso. Por
ejemplo, si se calculan para la población, se usan letras griegas para decir que se calculó
un parámetro (la media se escribe como μ), pero si se calcularon para una muestra,
entonces se escriben con letras latinas, por ejemplo, la mediana, la moda y la media, se
~
escriben respectivamente como x , x^ y x̄ . :
1. Lás fórmulas que se utilizan para calcular algunas medidas para datos agrupados,
son las siguientes:
n
a) ~
x =L Me + ( f Me
2
−∑ f i
) i
Δ1
b ) x^ =L Mo +
( Δ1+ Δ2
i
)
c ) x̄=
∑ mf
n
Donde en la fórmula a) que sirve para calcular la mediana, LMe es el límite inferior
de la clase que contiene a la mediana. Para hallarla, supongamos que si n=142. El
dato 71 deberá ser la mediana. Se procede a contar en el cuadro de frecuencias
desde la primer clase, acumulando las frecuencias, la clase que contiene al dato 71,
hasta que la suma de frecuencias supere el valor de 71, por primera vez. Esa será la
clase mediana. La sumatoria de la fórmula a), es la suma de las frecuencias de las
clases anteriores a la clase mediana. Los símbolos, i y fMe son la longitud de la clase
(nominal) y la frecuencia de la clase mediana, respectivamente.
Para calcular la moda, se usa la fórmula b), donde LMo es el límite inferior de la clase
modal. Esta clase se puede identificar como la clase que tiene la mayor frecuencia
en el cuadro de frecuencias (si existiera más de una, entonces la moda no debe
calcularse.) Los símbolos 1 y 2 son, respectivamente, la diferencia de frecuencias
entre la clase modal y la premodal, y la diferencia de frecuencias entre la clase
modal y la clase posmodal. Las clases premodal y posmodal son la anterior y la
1
posterior a la clase que se identificó como la clase modal. Por ejemplo, si la clase
modal tiene 50 datos y la premodal 35, entonces 1=15. Si la clase posmodal
contiene 16 datos, entonces 2= 34. Ambas clases se identifican en el cuadro de
frecuencias.
Para calcular la media c) se calcula cada una de las marcas de clase usando el
cuadro de frecuencias y se construye una columna donde se escribirá en la fila
correspondiente a cada clase su marca de clase m; luego se construye otra columna
donde se realizará el producto por fila de cada marca por su frecuencia
correspondiente, mf, y finalmente todos estos productos se sumarán. Finalmente esta
suma se dividirá por n, el número de datos para hallar la media.
Ahora se presenta el reporte de estadística descriptiva para los datos de los salarios.
Este reporte tiene 4 partes para los resultados de los salarios de los obreros
petroleros y de los textiles. Para estos, la primer sección (Summary section of
textil), da el resultado de la desviación estándar, el número de datos (count) y los
valores máximo y mínimo del grupo de datos; la segunda sección (Means section of
textil), da la media (mean) en la fila que dice Value, la mediana, la moda (que no
calcula porque hay muy pocos datos que se repiten) y la suma de los datos de los
textiles (los demás valores no tienen importancia para este curso.) La tercera
sección (Variation section of textil), da el rango intercuartil entre otras medidas que
por ahora no se explicarán y la cuarta sección (Quartile section of textil), da los
cuartiles de los datos de los salarios. Estos mismos datos se encontrarán para los
salarios de los petroleros.
2
Standard Unbiased Std Error Interquartile
Parameter Variance Deviation Std Dev of Mean Range
Value 497.5407 22.30562 22.32803 1.410731 19.41
145.37
Std Error 74.78999 2.370905 0.1499492
95% LCL 420.5271 20.50676 1.296961
95% UCL 597.9548 24.45312 1.546551
Para los petroleros se tiene la siguiente información, parecida a la que se describió para los
textiles:
3
I. Resuelve los siguientes problemas:
b) En la Estrategia 1.8 se te dieron datos (ejercicios II), para los que deberías construir
un histograma. Calcula para esos mismos datos la media, la mediana y la moda.
Localízalas en el histograma correspondiente.
d) Calcula edad media de la edades de la mujeres y de los hombres del país usando los
tabulados del INEGI. Calcula también la moda y la mediana.
e) Busca en la página del INEGI el tabulado donde está calculada la edad mediana de
hombres y mujeres por estado. Compara los valores que allí se te presentan,
calculando una mediana para hombres y mujeres usando la fórmula del punto 2,
para el estado que tú selecciones. ¿Por qué es importante conocer la edad mediana
de hombres y mujeres del país y por estado? ¿Qué significa este valor para este
problema
4
partir de los 40 años cuando el promedio es aproximadamente de 1 hijo. ¿Qué
concluyes de esta información? ¿qué nivel educativo crees que tiene una mujer
soltera de 40 años con un hijo? ¿y que nivel económico consideras que tiene? ¿Qué
razones crees que existen para que se dé este resultado? Como notarás, las
respuestas varían, pero muchas conclusiones que se obtienen con seguridad no son
válidas. Es necesario investigar en qué región se da más este fenómeno y buscar sus
causas, y no dar conclusiones apresuradas y sesgadas. Dado que los tabulados te
presentan esta información por estados, es probable que tengas más posibilidades de
dar con una de las razones por las que este fenómeno ocurre en México. (Compara,
¿a que edad consideras que las mujeres solteras tienen un promedio de un hijo en
Islandia? ¿por qué?)
g) Construye la ojiva para las edades de hombres y mujeres del país, usando los datos
de la población en los tabulados del censo del 2010. Usa los quinquenios y realiza
dos interpolaciones, las que tú quieras, una vez que hayas obtenido dichas curvas.
Compáralas. ¿Qué concluyes? (Se te aconseja usar números relativos.)
i) En los tabulados del INEGI se habla de la población total del país por Estado, edad
y grupos quinquenales de edad y su distribución según sexo. Calcula la media de
edades. ¿Cómo se distribuye la población?
j) Repite el problema anterior para dos Estados de la república que tu elijas y cuya
información está en los tabulados del INEGI. (Por ejemplo, pueden ser Zacatecas y
Colima.)
k) Busca las tablas donde se clasifica a la población femenina del país de 12 años o
más por Estado y grupos quinquenales de edad de mujeres y su distribución de hijos
nacidos vivos. Construye un histograma para los datos de la República (Estados
Unidos Mexicanos) de manera que en el eje horizontal coloques los quinquenios y
en el vertical la frecuencia absoluta.¿Cómo se distribuye la población?
m) (Para los aventurados) ¿Cuál es el promedio de hijos nacidos vivos de las mujeres
mexicanas mayores de 12 años? (Sugerencia: usa los tabulados del inciso f)
5
6