Medidas de Resumen-Tendencia Central
Medidas de Resumen-Tendencia Central
Medidas de Resumen-Tendencia Central
Medidas de Resumen:
Tendencia Central
(Borrador para corrección)
Santo domingo, D. N.
Febrero 2011
Importancia
Tendencia Central
Variabilidad o dispersión
Forma
¿Qué son?
Como su nombre lo indica, las medidas de tendencia central son aquellas que
describen el centro de una variable, indican un valor alrededor del cual se agrupa la
mayoría de los valores de un conjunto de datos. La Importancia de estas medidas
es que a partir de ella se puede caracterizar un grupo poblacional. Por ejemplo si
hacemos un estudio sobre las características de los consumidores de un producto,
y nos encontramos que la edad promedio es de 30 años, podemos describir a
nuestros consumidores cono una población joven. Aunque queda claro que hay
personas con más y menos edad, pero el promedio nos da un indicador del grupo
como un todo.
X =
∑X i
n
Ejemplo: De una población de 120 supermercados se tomó una muestra de cinco
de ellos y se calculó las ventas diarias de los mismos, (ventas expresadas en
cientos de miles de RD$. Los datos son 4.1, 2.9, 2.0, 4.5, 1.5
X=
∑X i
Todo conjunto de datos tiene una y sola una media aritmética o promedio.
El promedio o media aritmética no cambia significativamente cuando cambia
el tamaño de la muestra
El promedio o media aritmética es una medida representativa de los valores
de la variable, dado que la suma de la diferencia de cada valor de la variable
menos el promedio es igual a cero, Σ(Xi – X ) = 0
Demostración
Total = N × X
Principales desventajas
X =
∑X i × fi
n
( X 1 × f1 ) + ( X 2 × f 2 ) + .... + ( X n × f n )
X =
n
0, 1, 0, 2, 1, 5, 3, 0, 5, 1, 0, 0, 4, 4, 0, 0, 2, 0, 2, 3, 5, 0, 1, 5, 4
Como se observa, el cero se repite nueve veces, el uno cuatro veces, el dos tres
veces, el tres dos veces, el cuatro tres veces y el cinco cuatro veces, luego el
promedio es:
X =
∑X i × fi
n
(0 × 9) + (1 × 4) + (2 × 3) + (3 × 2) + (4 × 3) + (5 × 4)
X =
25
48
X = = 1 . 92 quejas
25
RV= 5 – 0
RV= 5
Los pasos para obtener el promedio a partir de datos agrupados en una distribución
de frecuencia simple son:
Número
de quejas fi
(Xi) Xi × fi
0 9 0
1 4 4
2 3 6
3 2 6
4 3 12
5 4 20
Total 25 48
X =
∑ (X i × fi )
n
48
X = = 1 .92 quejas
25
Cuando los datos están agrupados en una distribución de frecuencia con clases, no
se tiene un valor único de la variable, sino que se dispone de un rango de valores,
por lo que el valor de la variable, Xi, se representa por el punto medio o marca de
clase, el cual se obtiene sumando el límite inferior y límite superior de cada clase y
este resultado dividido entre dos.
Li + Ls
X i =
2
Los pasos para obtener el promedio a partir de datos agrupados en una distribución
de frecuencia con clase son:
Número de
fi
pacientes
22 – 34 7
34 – 46 4
46 – 58 5
58 – 70 5
70 – 82 6
82 – 94 3
Total 30
22 + 34 34 + 46 46 + 58
X1 = = 28 X 2 = = 40 X 3 = = 52
2 2 2
58 + 70 70 + 82 82 + 94
X 4 = = 64 X 5 = = 76 X 6 = = 88
2 2 2
El siguiente paso consiste en multiplicar cada valor del punto medio por su
respectiva frecuencia, como se muestra en la columna cuatro de la tabla siguiente.
Número
(2) (3) (4) = 2 × 3
de
fi Xi Xi × f i
pacientes
22 – 34 7 28 196
34 – 46 4 40 160
46 – 58 5 52 260
58 – 70 5 64 320
70 – 82 6 76 452
82 – 94 3 88 264
Total 30 1,652
X =
∑ (X i × fi )
=
1, 652
= 55 . 1 pacientes
n 30
La Mediana
La mediana es una medida de posición que divide la variable en dos partes iguales,
de forma que la mitad de los elementos se quedan por debajo de la mediana y la
otra mitad por encima de esta. Su principal uso es en aquellas variables que cuyo
comportamiento sigue una distribución no simétrica o en distribuciones de
frecuencia con clases abiertas.
Características
0, 1, 0, 4, 2, 1, 5, 3, 0, 5, 1, 0, 0, 4, 4, 0, 0, 2, 0, 2, 3, 5, 0, 1, 5.
0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 5, 5, 5, 5
2. Orden de la mediana
(n + 1)
OM =
2
(25 + 1)
OM =
2
26
OM = = 13
2
Me = 1 queja.
Número de
fi
quejas (xi)
0 9
1 4
2 3
3 2
4 3
5 4
Total 25
Número de
fi FA
quejas (xi)
0 9 9
1 4 13
2 3 16
3 2 18
4 3 21
5 4 25
Total 25
El orden de la mediana se obtiene con igual procedimiento que con los datos
simples, es decir,
(n + 1)
OM =
2
(25 + 1)
OM =
2
26
OM = = 13
2
Me= 1 queja
OM − FA−1
M e = Li + × I
fm
Me: Mediana
Li : Límite inferior de la clase que contiene a la mediana
OM : Orden de la mediana
FA-1: Frecuencia acumulada hasta la clase anterior a la clase de la mediana.
fm: Frecuencia absoluta simple de la clase que contiene a la mediana
I: Intervalo de la clase de la mediana
Número de
fi
pacientes
22 – 34 7
34 – 46 4
46 – 58 5
58 – 70 5
70 – 82 6
82 – 94 3
Total 30
Número de
fi FA
pacientes
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30
A partir de esta información se tienen los datos necesarios para determinar el valor
de la mediana
Li = 46
OM = 15.5
FA-1 = 11
fi = 5
I = 12
OM − FA−1
M e = Li + × I
fm
Luego, sustituyendo:
15.5 − 11
M e = 46 + ×12 , realizando los cálculos
5
Me = 46 + 10.8
Me ≈ 57 pacientes
Interpretación de la mediana:
Como la mediana divide al conjunto de datos en dos partes iguales, se puede decir
en que la mitad de los médicos atienden menos de 57 pacientes a la semana y la
otra mitad atiende a por encima de esta cantidad.
Es una medida que se aplica tanto a datos cuantitativos como para datos
cualitativos.
Su valor no es afectado por valores atípicos en los extremos
Su valor no está definido algebraicamente
En un conjunto de datos puede existir más de una muestra y es posible
también que no haya moda.
Si un conjunto de datos tiene una sola moda, se le denomina unimodal, si
tiene dos modas se le denomina bimodal y tiene tres o más se le denomina
multimodal.
0, 1, 0, 4, 2, 1, 5, 3, 0, 5, 1, 0, 0, 4, 4, 0, 0, 2, 0, 2, 3, 5, 0, 1, 5,
Como se observa en los datos, el valor que más se repite es el cero, por tanto, para
este conjunto de datos, la moda está dada por:
Mo = 0 quejas
∆1
M o = Li + × I
∆1 + ∆ 2
Donde:
Mo: Moda
Li : Límite inferior de la clase modal
∆1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior
a ésta
∆2 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior a ésta
I : Intervalo de la clase modal
Número de
pacientes fi
22 – 34 7
34 – 46 4
46 – 58 5
58 – 70 5
70 – 82 6
82 – 94 3
Total 30
La clase modal es la clase que tiene mayor frecuencia absoluta simple. En este caso
la clase modal es la primera, cuya frecuencia absoluta es siete. De ahí se obtienen
los siguientes datos:
Li = 22
∆1 = 7 – 0 = 7
∆2 = 7 – 4 = 3
I = 12,
7
Sustituyendo: M o = 22 + ×I
7+3
Mo= 22 + 8.4,
Mo ≈ 30 pacientes
¿Qué son?
Son medidas de localización similares a las de tendencia central, solo que estas no
necesariamente describen el centro de una variable, sino que describen una medida en
una posición determinada. Por ejemplo, con estas medidas podemos saber cual es el valor
por debajo del cual se encuentra un porcentaje determinado, igual podemos saber, por
ejemplo, cual es el valor mínimo que garantiza un porcentaje determinado por encima o
por debajo de un valor. Estas medidas se les denominan CUANTILES (Q) y su función es
informar del valor de la variable que ocupará la posición (en tanto por ciento) que nos
interese respecto de todo el conjunto de variables.
Podemos decir que los Cuantiles son unas medidas de posición que dividen a una variable
o conjunto de datos en partes iguales, de manera que en cada una de ellas contiene el
mismo número de los elementos de una población
Importancia
PERCENTILES, Estas medidas dividen a la distribución en 100 partes (99 divisiones). P1,
P2,..., P99, correspondientes a 1.0%, 2.0%,..., 99.0%.
Cuartiles
Los cuartiles, (Qk) son medidas que dividen a la variable en cuatro partes iguales,
de forma tal que la cada cuartel representa un 25.0% de los datos. Para calcular
estas medidas se sigue el mismo procedimiento que el utilizado para calcular la
mediana, de hecho, el cuartil dos (Q2) es igual a la mediana, de forma tal que en
datos sueltos, el procedimiento de cálculo sigue tres pasos
k × (n + 1)
OQk =
n
70, 81, 60, 70, 71, 75, 83, 90, 85, 65, 50, 80, 74, 90, 81, 83, 85, 82, 91, 76
50, 60, 65, 70, 70, 71, 74, 75, 76, 80, 81, 81, 82, 83, 83, 85, 85, 90, 90, 91
(n + 1)
OQ1 =
4
20 + 1
OQ1 =
4
21
OQ1 = = 5.25
4
Para encontrar la posición del Q1, se redondea el orden del cuartil al entero
siguiente, en este caso a seis. Luego el valor del Q1 sería el valor que se encuentra
en la posición 6, en este caso, 71, por lo que
Q1= 71 puntos
Este resultado indica que el 25.0% de los empleados tiene un nivel de motivación
por debajo de 71 puntos.
3 × (n + 1)
OQ3 = ,
4
63
OQ3 = = 15.75 , redondeando al entero siguiente OQ3= 16
4
Q3= 85 puntos
Este resultado indica que el 75.0% de los empleados tiene un nivel de motivación
por debajo de 85 puntos. También se puede decir que la puntuación 85 es el valor
que limita el rango percentilar del 75.0%
Percentiles
Los Percentiles, (Pk) dividen la variable en 100 partes iguales, por lo que cada
percentil representa un 1.0% de los datos. El procedimiento para el cálculo es el
mismo que el utilizado por los cuartiles:
k × (n + 1)
OPk =
100
Para el cálculo del P35 calcular el orden percentil deseado, en este caso 35. (se
obvia el paso de ordenar los datos, dado que estos ya lo estaban)
Datos ordenados:
50, 60, 65, 70, 70, 71, 74, 75, 76, 80, 81, 81, 82, 83, 83, 85, 85, 90, 90, 91
Orden P35, es
35(20 + 1)
OP35 =
100
735
OP35 = = 7.35
100
Redondeando al entero siguiente el orden del percentil, OP35 = 8, por lo que el valor
del P35 es el que se encuentra en la posición 8, para el ejemplo, este valor es 75,
luego
P35 = 75 puntos
Este resultado indica que el 35.0% de los empleados tiene un nivel de motivación
por debajo de 75 puntos.
OQK − FA−1
Para un cuartil k, Qk = Li + × I
fk
Número de
fi FA
pacientes
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30
3 × ( n + 1)
OQ 3 =
4
3 × (30 + 1)
OQ 3 =
4
3 × 31 93
OQ 3 = = = 23 .25
4 4
Para saber cual es la clase que contiene al cuartil tres, Q3 se busca en la frecuencia
acumulada el primer valor que sea mayor o igual al orden del Q3 y la clase a que
corresponda esta frecuencia es la clase del la medida buscada
Número de
pacientes fi FA
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30
Li = 70
OQ3 = 23.25
FA-1 = 21
fi = 6
I = 12
OQ3 − FA−1
Q3 = Li + × I
f3
Sustituyendo:
Q3 = 70 + 4.5
Q3 ≈ 75 pacientes
Este resultado indica que el 75.0% de los médicos atiende menos de 75 pacientes a
la semana.
90 × ( n + 1)
OP90 =
100
90 × (30 + 1)
OP90 =
100
90 × 31
OP90 =
100
2,790
OP90 = = 27 .90
100
Para saber cual es la clase que contiene el percentil 35, P35 se busca en la
frecuencia acumulada el primer valor que sea mayor o igual al orden del P35 y la
clase a que corresponda esta frecuencia es la clase del percentil buscado
Número de
pacientes fi FA
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30
Li = 82
OP90 = 27.90
FA-1 = 27
fi = 3
I = 12
OP − FA−1
P90 = Li + 90 ×I
fp
Sustituyendo:
27.90 − 27
P90 = 82 + × 12
3
P90 = 82 + 3.6
P90 ≈ 86 pacientes
Este resultado indica que el 90.0% de los médicos atiende menos de 86 pacientes a
la semana. Equivale a decir que el 10.0% de los médicos que más atienden
pacientes consultan más de 86 personas por semana.
Calcular e interpretar
3. El salario diario pagado por una empresa a un grupo de empleados es como sigue
4. Los pesos en gramos de cierto producto agrícola, han sido anotados, así como la
frecuencia de presentación en un cierto lote del producto.
Pesos 50 54 58 62 66 70 74 78 82
Frecuencia 6 11 16 28 46 30 21 14 8
Salarios
2.5 2.7 3.3 3.8 4.3 4.8
(en miles)
Nº de
150 101 52 31 22 14
personas
11.7 3.0 26.0 6.1 14.0 4.9 5.8 3.6 3.6 4.0
6.0 3.3 3.0 3.1 3.1 3.0 4.9 3.0 17.0 4.1
4.6 3.0 5.2 13.0 3.6 7.0 5.0 8.0 4.2 4.7
4.1 3.0 18.0 3.6 3.0 7.0 10.5 8.0 3.0 3.0
3.2 3.0 8.0 9.5 3.1 4.2 9.5 8.0 3.0 3.0