Medidas
Medidas
Medidas
Tendencia central:
La tendencia central se refiere al punto medio de una distribución.
Las medidas de tendencia central se denominan medidas de posición.
Variabilidad o dispersión:
La dispersión se refiere a la extensión de los datos, es decir al grado en
que las observaciones se distribuyen (o se separan).
Forma:
a) Sesgo (skewness): El sesgo es una medida de la asimetría de la curva.
En general es un valor que va de -3 a 3.
Una curva simétrica toma el valor 0.
0 0 1 1 2 2 4 4 5 5
6 6 7 7 8 12 15 15 15 19
La cantidad de pedidos
diarios que más veces
se repite es de 15.
Ejemplo: La cantidad de alumnos ausentes por día en un período de 20
ordenados en orden ascendente es
0 0 1 1 1 2 4 4 4 5
6 6 7 8 8 9 9 10 12 12
Esta distribución tiene 2 modas. Se la llama distribución bimodal . Mo = 1 Mo = 4
La cantidad de errores
de facturación diaria que
más veces se repiten son
1 y 4 (bimodal)
Cálculo de la moda para datos agrupados
Edad de los asistentes a Plan Salud, Club XX 2013
Edad fi fri Fi Fri
[47, 52) 4 0,029 4 0,029
d1 [52, 57) 9 0,066 13 0,095
Mo LMo .h [57, 62) 13 0,096 26 0,191
d1 d 2 [62, 67) 42
42 0,309 68 0,500
Mo Moda [67, 72) 39 0,287 107 0,787
[72, 77) 20 0,147 127 0,934
LMo Límite inferior de la clase modal
[77, 82) 9 0,066 136 1
d1 = fi – fi-1 frecuencia de la clase modal menos Intervalo modal: [62,67)
la frecuencia de la clase anterior a ella LMo = 62 d = 42 – 13 =29
1
d2 = fi – fi+1 frecuencia de la clase modal menos
d2 = 42 – 39 = 3 h =5
la frecuencia de la clase posterior a ella
La mitad de los datos son menores o iguales a 25,5 y la otra mitad mayores o iguales
Cálculo de la mediana para datos agrupados
Una muestra con n observaciones, tiene una media x (que se denomina estadística)
Una población con N elementos tiene una media (que se denomina parámetro)
x
x
x
N n
x
x 8 5 9 10 9 12 7 12 13 7 8
9,09
n 11
No calificará porque la edad promedio es mayor de 9 nueve años
Cálculo de la media para datos agrupados
Edad de los asistentes al Plan Salud, Club XX, 2013
x x .f i i
Edad xi fi fri Fi Fri
n
[47, 52) 49,5 4 0,029 4 0,029
mi marca de clase [52, 57) 54,5 9 0,066 13 0,095
fi frecuencia absoluta [57, 62) 59,5 13 0,096 26 0,191
n cantidad de datos [62, 67) 64,5 42 0,309 68 0,5
xi fi mi.fi [67, 72) 69,5 39 0,287 107 0,787
49,5 4 198 [72, 77) 74,5 20 0,147 127 0,934
54,5 9 490,5 [77, 82) 79,5 9 0,066 136 1
59,5 13 773,5
64,5 42 2709
69,5 39 2710,5
9087/136 =66,816
74,5 20 1490
79,5 9 715,5
Suma 9087 La edad promedio de los residentes del
complejo XX es de 66,816 años
Media 66,816
VENTAJAS Y DESVENTAJAS DE LA MEDIA
En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está
a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir,
x < Me < Mo
Cuando la población tiene una distribución sesgada, con frecuencia la
mediana resulta ser la mejor medida de posición, debido a que está siempre
entre la media y la moda. La mediana no se ve altamente influida por la
frecuencia de aparición de un solo valor como es el caso de la moda, ni se
distorsiona con la presencia de valores extremos como la media.
x 2
x2
2
N N
Aplicación de la desviación estándar poblacional
x 1 x 2 x 3
VARIANZA Y DESVIACIÓN ESTÁNDAR MUESTRAL
VARIANZA MUESTRAL:
x x
2
x 2
n.x
2
s 2
(x x ). f i
i
s 2
n 1 n 1 n 1 n 1
s2 : Varianza de la muestra xi marca de clase
x : Elemento u observación fi frecuencia absoluta
x Media de la muestra
n Número de elementos de la muestra
x x
2
x2 (x
2
s s 2
n.x x ). f i
n 1 n 1 n 1 s i
n 1
COEFICIENTE DE VARIACIÓN: es una medida relativa de dispersión que
expresa a la desviación estándar como
un porcentaje de la media
s
CV .100% en la población CV .100% en la muestra
x