Leccion 5
Leccion 5
Leccion 5
LECCION No. 5
5.1.1 La Mediana.
A diferencia de la media, que se relaciona con la suma de los valores de los datos, la
mediana tiene que ver con el orden de los datos, e identifica el dato que está “en el
centro. Por ejemplo si consideramos los datos: 1, 4, 6, 8, 3, 7, 11; los “ordenamos”,
ascendente o descendentemente, y obtenemos la serie:
1, 3, 4, 6, 7, 8, 11,
observamos que el dato “6” está “en el centro” de los otros datos. A este dato lo llamamos
mediana del conjunto de datos u observaciones. Cuando el número de datos es impar, es
muy fácil identificar la median, cuando el número de datos es para, cualquier valor entre
los dos términos del centro se podría proponer como median; sin embargo se utiliza el
promedio. Entonces la mediana pude expresarse como:
Es importante hacer notar que aunque los datos sean números enteros, la
mediana puede resultar un número con fracción decimal.
Al igual que la medida de dispersión que fue asociada a la media (la desviación estándar y
la varianza), en este caso construimos una medida de dispersión, asociada a la mediana,
para expresar la variabilidad de las observaciones alrededor de la mediana.
Definimos las desviaciones absolutas respecto a la mediana como:
Ejemplo: dadas las siguientes calificaciones sobre 10, ordenadas de menor a mayor:
Maestría en Planeamiento y Gerencia Educativa Metodos Cuantitativos I
Tercer Ciclo Modalidad Virtual
Leccion No. 5
1.7, 2.8, 3.2, 3.4, 5.3, 5.9, 6.2, 7.2, 8.3, 9.3
Nos da desviaciones absolutas: 0.3, 0.3, 0.6, 1.6, 2.2, 2.4, 2.7, 2.8, 3.7, 3.9
La idea que nos condujo a definir la mediana, fue la de “separar” la serie de datos en dos
partes, por medio del elemento (real o calculado) que está en el “centro”. De una manera
muy semejante ahora podemos separar en proporciones de igual tamaño; por ejemplo en
cuatro partes con el mismo número de elemento, en diez partes con el mismo número de
elementos o en cien partes iguales.
x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11,
Q 1, Q2 = medx Q3
Una forma de identificar a los cuarteles puede ser también, observando que el primer
quartil es el menor valor que supera a la cuarta parte de los datos y que el tercer quartil es
el menor valor mayor que las tres cuartas parte de las observaciones. Una medida de
dispersión asociada con los Quartiles es el llamado Rengo intercuartílico que corresponde
a la diferencia entre el tercer quartil y el primer quartil, esto es:
Maestría en Planeamiento y Gerencia Educativa Metodos Cuantitativos I
Tercer Ciclo Modalidad Virtual
Leccion No. 5
RI = Q3- Q1,
1.7; 2.8; 3.2; 3.4; 5.3; 5.9; 6.2; 7.2; 8.3; 9.3
Aquí, el primer quartil es 3..2; el tercer quartil es 7.2; por lo tanto el rango intercuartílico
está dado por: RI = 7.2 – 3.2 = 4.
De una manera totalmente análoga, introducimos los Deciles, dividiendo en diez tramos al
conjunto de datos; por lo tanto tendremos Primer decil D1; al menor valor que supera el
10% de los datos, Segundo decil D2, al menor valor que supera el 20% de los datos; etc.
Hasta llegar al Noveno decil D9, que es el menor valor mayor que el 90% de los datos.
Por último definimos lo Percentiles. Llamamos percentil de orden p, al menor valor que
supera al “p” por ciento de los datos. Nótese que el número de datos puede ser pequeño; y
sin embargo podemos hablar de los percenties. En el ejemplo anterior el percentil de órden
40 (que es el cuarto decil) es: 3.4 ; que es el menor valor que es mayor que el 40 % de los
datos. El percentil de órden 20, es 2.8; el percetnil de orden 60 es el dato 5.9.
El dato 83 es atípico (tiene un comportamiento muy diferente del resto de los datos); sin
embargo la mediana sigue siendo 5.6; sin embargo la media pasa a ser 12.8 y no 5.3,
como había salido cuando el dato consignado fue 8.3 y no 83 (ver ejemplos anteriores).
Decimos que es más robusta la mediana y sus desviaciones asociadas que la media y su
desviación estándar.
Maestría en Planeamiento y Gerencia Educativa Metodos Cuantitativos I
Tercer Ciclo Modalidad Virtual
Leccion No. 5
RESUMEN
La medida de tendencia central que separa la mitad de los datos menores de la mitad de
los datos mayores de una serie ordenada de observaciones, se llama mediana. Las
medidas de dispersión asociadas a la mediana son la MEDA, el rango y el rango
intercuartílico. Siempre debemos darle un tratamiento especial a aquellos datos que se
alejan del comportamiento del grueso de los datos, a estos datos “raros” los llamamos
datos atípicos. Por la poca sensibilidad que la mediana y sus medidas de dispersión
tienen ante los datos atípicos, se dice que la mediana es más robusta que la media.