Clase 05
Clase 05
Clase 05
Clase 05
Tabla de contenidos
Estadística descriptiva
Distribución de datos
Medidas de variabilidad
Introducción
¿Por qué necesitamos calcular estadísticas?
Impar Par
[1, 2, 3, 5, 7, 8, 9, 10, 15] [-5, -1, 0, 1, 2, 3, 8, 20]
9 elementos 8 elementos
La mediana es el valor de la posición 5 La mediana es la media de los valores en las dos
(la posición del “medio”) posiciones centrales
Mediana = 7 Mediana = (1+2)/2 = 1.5
Medidas de Tendencia Central
Promedio con valores extremos Mediana con valores extremos
[1, 2, 3, 5, 7, 8, 9, 10, 150] [1, 2, 3, 5, 7, 8, 9, 10, 150]
Por ejemplo
La moda de [0,1,1,2,2,2,2,3,3,4,4,4,5] es 2.
Rango intercuartil
Es la diferencia entre el primer y el tercer cuartil de la distribución. Acumula el
50% de la distribución y, a diferencia del rango, es un estadístico robusto, es
decir que se ve poco afectado por valores extremos.
Medidas de Dispersión o
Variabilidad: Varianza
La varianza es un valor numérico utilizado para describir cuánto varían los
números de una distribución respecto a su media. Si tenemos un conjunto de
valores de una variable, la varianza se calcula de la siguiente forma:
xi : cada dato
x: media de los datos
n: número de datos