Modulo 2 de Estadistica y Probabilidad
Modulo 2 de Estadistica y Probabilidad
Modulo 2 de Estadistica y Probabilidad
2
variabilidad
Introducción
En el módulo anterior se analizaron los tipos de variables y se presentó la forma de
presentar datos por medios gráficos. La distribución de frecuencias es útil con
respecto a la presentación gráfica de los datos, pero en sí misma no permite estable-
cer comparaciones entre dos o más distribuciones. A menudo se desea describir en
forma cuantitativa las características de las distribuciones, para lo cual es importan-
te obtener las medidas de tendencia central y de variabilidad.
Una medida de tendencia central de un conjunto de datos proporciona una idea del Los directivos de una facultad necesitan
saber las notas promedio de los estudiantes
valor central de un conjunto aparentemente desordenado de observaciones, y una de un determinado semestre para asignar
medida de variabilidad nos permite determinar de qué forma está disperso un dato las becas de estudio para el siguiente
con relación a los otros de la distribución. semestre.
Preguntas básicas
1. ¿Cuál es la diferencia entre la media, la mediana y la moda?
2. ¿Cuáles son las medidas de variabilidad más utilizadas?
3. ¿Cómo se interpreta el diagrama de cajas y bigotes?
Se define como la suma de los datos dividida entre el número de los mismos:
¦X
n
i
i 1
X ,
n
en donde
n : número de observaciones.
X : valor de cada observación.
X : media aritmética o simplemente media.
Ejemplo
5, 2, 8, 2, 3, 2, 4, 0, 6.
Solución
¦X
n
i 1
i
5 28 2 3 2 4 0 6
X 3.55.
n 9
2.1.2 Mediana
Se define como el valor que divide una distribución de datos ordenados en dos
mitades. La mediana es menos sensible a los datos extremos y se denota como X .
30
Módulo 2: Medidas de tendencia central y de variabilidad
Ejemplo
Solución
2.1.3 Moda
Es el valor que ocurre con mayor frecuencia (aunque puede existir más de una moda
para un conjunto de datos).
Ejemplo 1
40, 37, 6, 4, 4, 4, 2, 1, 1.
Solución
Para ilustrar las tres medidas de centralidad se muestran a continuación gráficas con
sus correspondientes valores de media, mediana y moda (figura 2.1).
Ejemplo 2
Estadística
31
Capítulo 1: Estadística descriptiva
Fumadores: 69.3, 56.0, 22.1, 47.6, 53.2, 48.1, 52.7, 34.4, 60.2, 43.8, 23.2, 13.8.
No fumadores: 28.6, 25.1, 26.4, 34.9, 29.8, 28.4, 38.5, 30.2, 30.6, 31.8, 41.6,
21.1, 36.0, 37.9, 13.9.
Encuentre la media, la mediana y la moda de cada una de las muestras y comente qué
clase de impacto parece tener el fumar sobre el tiempo que se requiere para quedar
dormido.
Solución
Fumadores
1. Media:
69.3 56.0 ... 23.2 13.8
X 3.7.
12
2. Mediana:
Datos ordenados:
13.8, 22.1, 23.2, 34.4, 43.8, 47.6, 48.1, 52.7, 53.2, 56.0, 60.2, 69.3.
47.6 48.1
X 47.85.
2
No fumadores
1. Media:
28.6 25.1 26.4 ... 37.9 13.9
X 30.32.
15
2. Mediana:
Datos ordenados:
13.9, 21.1, 25.1, 26.4, 28.4, 28.6, 29.8, 30.2, 30.6, 31.8, 34.9, 36.0,
37.9, 38.5, 41.6.
32
Módulo 2: Medidas de tendencia central y de variabilidad
2.2.1 Rango
Se define como la diferencia entre las observaciones máxima y mínima de una distri-
bución:
R X máx X mín .
Ejemplo
Solución
R X máx X mín 5 1 4.
2.2.2 Cuartiles
Ejemplo
562, 869, 708, 775, 704, 809, 856, 655, 806, 878, 909, 918, 558, 768, 870, 918, 940,
946, 661, 820, 898, 935, 952, 957, 693, 835, 905, 939, 955, 960, 498, 653, 730 y 753.
Estadística
33
Capítulo 1: Estadística descriptiva
498, 558, 562, 653, 655, 661, 693, 704, 708, 730, 753, 768, 775, 806, 809, 820, 835,
856, 869, 870, 878, 898, 905, 909, 918, 918, 935, 939, 940, 946, 952, 955, 957, 960.
El primer cuantil es el valor para el cual al menos (0.25)(34) = 8.5 de las medidas son
iguales o menores que él y al menos (0.75)(34) = 25.5 valores son mayores que él; de
esta forma 8 valores son iguales o menores de 704 y 26 valores están situados por
encima de 704. Luego el primer cuantil es Q1 = 704.
2.2.3 Deciles
Dividen el conjunto de datos en diez partes iguales, en las que el primer decil
corresponde al valor por debajo del cual está el 10% de las observaciones, el segun-
do decil corresponde al valor por debajo del cual está el 20% de las observaciones
y así sucesivamente.
2.2.4 Percentiles
Un percentil es el valor sobre la escala de medida debajo del cual cae un porcentaje
dado de los datos en la distribución.
Q Q3 Q1 .
Ejemplo
34
Módulo 2: Medidas de tendencia central y de variabilidad
¦(X X )2
n
n 1
i 1
S .
¦(X X )2
n
n 1
2 i 1
S .
Ejemplo
9, 6, 4, 6, 5, 8, 7, 6, 7, 0.
Solución
Puesto que
96 46587670
X 5.8,
10
se tiene que
¦(X 5.8) 2
10
i
i 1
S 1.5748.
9
Estadística
35
Capítulo 1: Estadística descriptiva
La figura 2.2 muestra un diagrama de cajas y bigotes para un conjunto de datos que
es simétrico, donde la mediana está en el centro de la caja y los bigotes tienen la
misma longitud.
Las figuras 2.3 y 2.4 ilustran dos diagramas de cajas y bigotes para un conjunto de
datos sesgados. Si la distribución está sesgada hacia la derecha, la mediana está
ubicada hacia el lado izquierdo del centro de la caja, y si está sesgada a la izquierda,
la mediana está ubicada hacia el lado derecho del centro de la caja. Así mismo se
puede observar que las longitudes de los bigotes son diferentes para los dos gráfi-
cos, lo que indica que hay asimetría en el conjunto de datos.
Resumen
Se presentaron las medidas de centralidad y de variabilidad utilizadas para analizar variables únicamente de tipo
cuantitativo. Además se presentó un gráfico que permite agrupar estas dos medidas (el diagrama de cajas y bigotes),
que es muy útil ya que en él se ve claramente qué tanto están dispersas las observaciones y cuál es su valor central.
36