Medidas de Tendencia Central
Medidas de Tendencia Central
Medidas de Tendencia Central
Definiciones:
Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados s
también conocidos como estadigrafos, la media aritmética, la mediana, la moda y al rango medio.
La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de obse
los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremo
información de los datos.
La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados
mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones
La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores e
Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas observa
posición, pero
ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos.
Datos Discretos
No Agrupados
Analicemos para ello las edades que utilizamos cuando se vió la organización y presentación de datos discretos:
12 15 14 15 16
18 19 14 15 17
Estos
15 17 18 16 19
16 17 15 15 17
16 18 17 19 17
23 16 17 18 19
fueron loa datos mostrados originalmente, no se han ordenado ni agrupado, determinemos ahora los valores de la
Media, la Mediana y la moda, para ello recurramos a las fórmulas de estas medidas que resumimos en la siguiente tabla:
Para la media:
_ 12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 + 15 + 17 + 16 + 18 + 17 +
19 + 17 + 23 + 16 + 17 + 18 + 19
X = ----------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 500
X = ------------ = 16.6667
30
Para la mediana debera ordenarse el grupo de datos, como n = 30, utilizaremos la posición p = (30/2) = 15,
el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7
veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar
la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento
no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los r
ven modificadas.
Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado utilizando:
En donde podemos observar la suma de las frecuencias y de los años multiplicados por la clase que agrupa a los datos coin
utilizando ahora las formulas de la siguiente tabla:
Para la media:
_ 12 * 1 + 14 * 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 * 1 12 + 28 + 90 + 80 + 119 + 72 + 76 + 23
X = -------------------------------------------------------------------------------------------- = ---------------------------------------------------------------
30 30
_ 500
X = ------------ = 16.6667
30
Para la Mediana, utilizaremos la frecuencia acumulada:
Cl Frecu Frecu
as encia encia
e Acum
ulada
12 1 1
14 2 3
15 6 9
16 5 14
17 7 21
18 4 27
19 4 29
23 1 30
To 30
tal
Como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.
La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7 veces
en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la
información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no
afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios
en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.
Datos Continuos
No agrupados
Las medidas de tendencia central para datos continuos no agrupados no tienen mayor significación,
ya que el comportamiento es similar al de datos discretos no agrupados, por ello utilizaremos las mismas formúlas, pero ahor
Para la media, aplicando la formula de la media para datos no agrupados (vista en la sección de datos discretos):
_ 1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23 + 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 +
1.28 + 1.29 + 1.28 + 1.21 + 1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X = -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
30
_ 44.93
X = ------------ = 1.24805556
30
La moda estaría determinada por observación directa, y corresponderían a los valores 1.24, 1.25 y 1.27 que se repiten en la
trimodal (normalmente se le conoce como multimodal).
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la información (así
ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Agrupados
continuos agrupados.
Clases Li Ls Mc F fa
I 1.175 1.203 1.189 6 6
II 1.213 1.241 1.227 10 16
III 1.251 1.279 1.265 10 26
IV 1.289 1.317 1.303 9 35
V 1.327 1.355 1.341 1 36
En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica (de no conocer los datos
originales) que por ejemplo esos 6 valores de la clase pueden ubicarse en cualquier valor del rango, pueden ser
Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos parametros como elementos
para el cálculo de las medidas de tendencia central, por ello se realizó el cálculo de la Mc (Marca de Clase) que en
otras palabras es el rango medio de cada clase, que servirá para el cálculo de la media como lo establecemos
Clases Li Ls Mc F fa fc
I 1.175 1.203 1.189 6 6 30
II 1.213 1.241 1.227 10 16 20
III 1.251 1.279 1.265 10 26 10
IV 1.289 1.317 1.303 9 35 1
V 1.327 1.355 1.341 1 36 0
36
45.122
Media = ---------------- = 1.253388889
36
Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo percentil), para ello determinamos
Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el primer elemento mayor
2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
10
La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan, por lo tanto podemos definir
que existen una característica de multimodalida en la muestra, calculemos la primera moda (dejamos como actividad
( 10 – 6) 4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
(2* 10 – 6 – 10) 4
Mo = 1.241
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la información
(así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera
directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Medida No Agrupados
agrupados
Puede en esta tabla observarse una diferencia marcada en los valores obtenidos por agrupamiento y no
agrupamiento para la media, la mediana y la moda, la última, por observación en el caso de no agrupamiento nos
presenta 3 modas, mientras que en el agrupamiento, se obtienen 2 modas, la realidad es que el agrupar datos
continuos se tiene una perdida de valores por la aproximación que se tiene al calcular por ejemplo la marca de clase
Después de estos ejercicios que realizamos para la determinación de las medidas de tendencia central, para datos
discretos y continuos tanto agrupados como no agrupados, realicemos los ejercicios de evaluación de esta sección,
para ello baja el documento correspondiente en la sección de archivador (Ejercicios de Medidas de Tendencia
Central.pdf) , resuelve los ejercicios (de preferencia en excel o en un software estadístico (spss, minitab, etc.)
posteriormente envíalo a: leonardo.hernandez@gmai.com o sube tus respuestas en los archivos adjuntos de esta página.
¿Qué son cuartiles?
Los cuartiles son valores que dividen una muestra de datos en cuatro partes
iguales. Utilizando cuartiles puede evaluar rápidamente la dispersión y la tendencia
central de un conjunto de datos, que son los pasos iniciales importantes para
comprender sus datos.
Cuartil Descripción
1er cuartil 25% de los datos es menor que o igual a este valor.
(Q1)
2do cuartil La mediana. 50% de los datos es menor que o igual a este
(Q2) valor.
3er cuartil 75% de los datos es menor que o igual a este valor.
(Q3)
Por ejemplo, para los siguientes datos: 7, 9, 16, 36, 39, 45, 45, 46, 48, 51
Q1 = 14.25
Q2 (mediana) = 42
Q3 = 46.50