Cuadernillo 3 (Medidas de Tendencia Central)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 20

Estadística I

Cuadernillo N°3

MEDIDAS DE
TENDENCIA
CENTRAL
MEDIDAS DE TENDENCIA CENTRAL

En un trabajo estadístico, luego de recopilar y organizar la información, es necesario


obtener algunos indicadores que resuman la información recopilada. Estos indicadores se
denominan medidas estadísticas.
Las medidas estadísticas obtenidas con datos poblacionales se denominan parámetros,
mientras que las medidas estadísticas que se obtienen con datos muestrales se
denominan estadísticos o estimadores.
Las medidas estadísticas más importantes las agruparemos de la siguiente manera:
* Medidas de Tendencia Central
* Medidas de Variabilidad
* Medidas de Forma

1. MEDIA ARITMÉTICA (Promedio Aritmético)


Para un conjunto de datos cuantitativos, la media aritmética se determina como la
división entre la suma de todos los datos y el número total de datos sumados, es
decir:
Suma de todos los datos
Media Aritmética =
Número total de datos

Características de la media aritmética:


1. Es el valor más representativo de un conjunto de datos, debido a que es el
centro de gravedad o punto de equilibrio de dicho conjunto de datos.
2. Se ve afectada por los valores extremos. Es decir, los valores extremos influyen
en el valor de la media y por lo tanto pueden no reflejar una tendencia real del
grupo.
3. Es un indicador eficiente cuando no existen valores extremos que la afecten.
4. Sólo es aplicable a datos cuantitativos.
5. Tiene la misma unidad de medida que los datos.
6. Puede tomar cualquier valor real (positivo, negativo o cero).
7. Su valor se encuentre dentro del rango de valores de la variable.

-2- Estadística para la Universidad


Medidas de Tendencia Central

La media aritmética, según el peso o la importancia de cada dato dentro del conjunto de
datos, se puede clasificar como simple o ponderada.

1.1 MEDIA ARITMÉTICA SIMPLE


Se utiliza cuando todos los datos tienen la misma proporción, peso o importancia
dentro del conjunto de datos.

¿Cómo se determina la media aritmética de un conjunto de datos?


Depende de la forma como estén agrupados los datos o si no lo están.

i. Si los datos NO están agrupados en tablas de frecuencia, la media aritmética


se determina de la siguiente manera:
N
1
Media Poblacional: =
N
 xi (N: tamaño de la población)
i =1

1 n
Media Muestral: x =
n

xi (n: tamaño de la muestra)
i =1

Ejercicio #1
Suponga que una empresa fabricante de condimentos realiza un muestreo en un lote
de bolsas de pimienta molida para evaluar el peso en gramos del contenido. Los
pesos obtenidos se muestran en el cuadro:

20,3 20,4 20,5 21,0 21,4 21,8 21,9 22,1 22,2

22,5 22,6 22,6 22,6 22,7 22,8 22,9 22,9 23,2

23,3 23,3 23,4 23,5 23,8 24,3 24,5 24,5 24,6

24,6 25,2 25,3 25,6 25,7 26,1 26,2 26,3 27,4

Determine el peso promedio del contenido de las bolsas de pimienta.


Rpta. 23,4 gramos.

Estadística para la Universidad -3-


Medidas de Tendencia Central

ii. Si los datos corresponden a una variable discreta y están agrupados en


tablas de frecuencias, la media aritmética se determina de la siguiente manera:

1 k k
Media Poblacional:  =
N
 fi xi = 
fri.xi (k: número de valores de la variable)
i =1 i =1

1 k k
Media Muestral: x = f x =  fri.x i (k: número de valores de la variable)
n i =1 i i i =1

Ejercicio #2
Se supone que cada caja de cereales debe contener 200 pasas. Sin embargo, una
muestra de 60 cajas, mostró el siguiente número de pasas en cada caja.

Numero de Numero de
pasas cajas
195 3
196 4
197 4
198 5
199 6
200 11
201 4
202 6
203 4
204 4
205 4
206 5

Determine el número promedio de pasas que podemos encontrar por caja.


Rpta. 201 pasas aproximadamente

-4- Estadística para la Universidad


Medidas de Tendencia Central

iii. Si los datos corresponden a una variable continua y están agrupados en


tablas de frecuencias, la media aritmética se obtiene de la siguiente manera:

k k
1
Media Poblacional: 
N  Mi fi   Mi fri (Mi: marca de clase)
i =1 i =1

k k
1
Media Muestral: x 
n  mi fi   mi fri (mi: marca de clase)
i =1 i =1

(k = número de intervalos de clase)

Nota: En este caso la media tiene un valor aproximado debido al uso de las marcas
de clase. Como sabemos las marcas de clase no necesariamente son iguales al
promedio de las observaciones.

Ejercicio #3
En un estudio acerca de los ingresos mensuales (en soles) de los 420 trabajadores
de una empresa, se obtuvo los siguientes resultados:

INGRESOS MENSUALES NÚMERO DE


(soles) TRABAJADORES

De 500 a menos de 1000 60

De 1000 a menos de 1400 80

De 1400 a menos de 2000 95

De 2000 a menos de 2600 130

De 2600 a menos de 3000 45

De 3000 a más. 10

Estime el ingreso promedio mensual por trabajador.


Rpta. 1808,33 soles.

Estadística para la Universidad -5-


Medidas de Tendencia Central

PROPIEDADES DE LA MEDIA ARITMÉTICA


1. Si se sustituye el valor de cada observación por el valor de su media aritmética,
la suma total de los datos no varía.

2. La suma de las desviaciones de las observaciones con respecto a su media


aritmética, es cero:

n N
 (xi − x ) = 0 ,  (xi − ) = 0
i =1 i =1

3. La suma de los cuadrados de las desviaciones de las observaciones con


respecto a la media aritmética es menor o igual que la suma de los cuadrados
de las desviaciones de las observaciones con respecto a cualquier otro valor
constante.

n 2 n2
 (xi − x)   (xi − r) rR
i =1 i =1

N 2 N2
 (xi − μ)   (xi − r) rR
i =1 i =1

Esto también significa que la suma de los cuadrados de las desviaciones de las
observaciones con respecto a la media aritmética es mínima.

4. Si se tienen varias muestras, la media aritmética del total de datos está dada
por:
k

n1 x 1 + n 2 x 2 + n 3 x 3 + ...... + n k x k
 ni x i
x= = i =1
n1 + n 2 + n 3 + ....... + n k k
 ni
i =1

Esta propiedad se aplica de igual manera cuando se promedian los datos de


varias poblaciones.

-6- Estadística para la Universidad


Medidas de Tendencia Central

5. Si a todas las observaciones de un conjunto de datos se les suma y/o multiplica


una cantidad constante, la media del nuevo conjunto de datos es igual a la
media anterior sumada y/o multiplicada por dicha cantidad constante, es decir:

Yi = Xi + k Yi = Xi * k Yi = aXi + b

Muestra Yi = Xi + k Yi = Xi * k Yi = aXi + b

Población  yi =  xi + k  yi =  xi * k yi = axi + b

6. Si X, Y y W son variables tales que W = aX  bY, se cumple: W = aX  b Y

1.2. MEDIA PONDERADA


Se usa para determinar el promedio de las observaciones que tienen pesos o
importancias diferentes, es decir se usa para promediar datos cuya frecuencia no es
la misma.
Estos pesos Wi pueden ser números enteros, decimales, fracciones, porcentajes, etc.
Sea un conjunto de observaciones Xi con sus respectivos pesos Wi, la media
ponderada de los datos Xi está dada por:

k
 wix i
w 1 x 1 + w 2 x 2 + ........... + w k x k
x p = i =1 =
k w 1 + w 2 + ............. + w k
 wi
i =1

Nota: La media ponderada es un caso particular de la media aritmética, por tanto,


se ve afectada por los valores extremos.

Estadística para la Universidad -7-


Medidas de Tendencia Central

Ejercicio #4
Suponga que las notas promedio de un alumno matriculado el ciclo anterior en los
siguientes cursos, son:

Curso Créditos Nota


Estadística I 3 14
C.C.P.P. 3 18
Conta II 4 12
Macro I 5 13

Determine el promedio ponderado del ciclo para dicho alumno.


Rpta. 13,93

Ejercicio #5
Suponga las notas de un curso son:

Evaluación Notas Proporción


del curso por evaluación
PC 18, 16, 08, 14 50%
EP 12 20%
EF 10 30%

Determine la nota promedio del curso si el promedio de las PC es simple.


Rpta.: 12,4

-8- Estadística para la Universidad


Medidas de Tendencia Central

2. MEDIANA
Es el valor de la variable que ocupa la posición central de un conjunto de datos que
han sido previamente ordenados de acuerdo a su magnitud.

50% 50%

xmin Me xmáx

Cálculo de la mediana: (me: muestra; Me: Población)

i. Para datos No Agrupados o para datos discretos agrupados en tablas de


frecuencia:

* Si la cantidad de datos "n" es impar: me = X n + 1


2

X n +X n
[ ] [ +1]
me = 2 2
* Si la cantidad de datos "n" es par:
2

Ejercicio #6
Determine la edad promedio y la mediana de la edad en cada caso:

Datos Media Mediana


4, 5, 5, 6, 7, 7, 8, 10, 12, 12, 12, 13, 14
10, 11, 11, 12, 13, 15, 16, 17, 17, 18, 18, 19, 20, 20
8, 8, 9, 9, 9, 10, 11, 12, 12, 12, 13, 13, 14, 15, 17, 18
36, 38, 38, 39, 40, 41, 41, 42, 43, 43, 45, 46, 48, 50, 51

Ejercicio #7
Para los datos del ejercicio #2, determine el valor mediano del número de
pasas que contienen las cajas.
Rpta. 200 pasas/caja

Estadística para la Universidad -9-


Medidas de Tendencia Central

Nota: Para hallar la mediana de un conjunto de datos discretos o continuos


agrupados en tabla de frecuencias es conveniente encontrar alguna de
las frecuencias acumuladas para poder ubicar rápidamente donde se
encuentra la mitad de la información.

ii. Para datos continuos agrupados en tablas de frecuencia:

n / 2 − Fk−1 0,5 − Frk −1


me  LIk + TICk me  LIk + TICk
fk frk

Nota: La fórmula es la misma para Población y para Muestra. Sin embargo, para
Población usaremos el símbolo Me y para Muestra usaremos me.

Siendo: LIk = Límite inferior del intervalo donde se encuentra la mediana.


Fk-1 = Frecuencia absoluta acumulada del intervalo anterior al de la mediana.
fk = frecuencia absoluta no acumulada del intervalo de la mediana.
TICk = Tamaño del intervalo de clase donde se encuentra la mediana.

Nota: La mediana se encuentra en el intervalo donde se acumula la mitad de


los datos, puede ser en forma absoluta (Fi = n/2 ó N/2), relativa (Fri = 0,5) ó
porcentual (Pi = 50%).

Ejercicio #8
Para el ejercicio #3, estime el ingreso mensual mediano de los trabajadores de
la empresa.
Rpta. 1842,11 soles.

-10- Estadística para la Universidad


Medidas de Tendencia Central

Características de la Mediana

1. Divide a un conjunto de datos en dos partes iguales; el 50% de datos con


valores superiores a la mediana y el otro 50% de datos con valores inferiores a
la mediana.
2. Tiene la misma unidad de medida que las observaciones.
3. Es influenciada por el número de observaciones y no por los valores de éstas;
es decir, no le afectan los valores extremos de las observaciones.
4. Es un indicador eficiente cuando existen valores extremos que afecten a la
media aritmética.
5. Es el valor de equilibrio de la cantidad de observaciones.
6. Es aplicable solo para datos cuantitativos.
7. Su valor se encuentre dentro del rango de valores de la variable.

PROPIEDADES DE LA MEDIANA
1. La suma de las desviaciones absolutas (distancias) de las observaciones con
respecto a la mediana es menor o igual a la suma de las desviaciones absolutas
(distancias) de las observaciones con respecto a cualquier otro valor real.

n n
 x i − me   xi − k , k  R
i =1 i =1

Esto significa que la suma de las desviaciones absolutas de las observaciones


con respecto a la mediana es mínima.

2. Cuando a un conjunto de datos se le multiplica y/o se le suma una cantidad


constante su mediana se ve afectada en la misma medida, es decir:

Si Yi = a Xi + b  Me(Y) = a Me(X) + b

Estadística para la Universidad -11-


Medidas de Tendencia Central

3. MODA
Es el valor, dato, registro, observación, clase o categoría que aparece con mayor
frecuencia dentro de un conjunto de datos.

Moda = dato u observación con mayor frecuencia

Nota: Esta definición es aplicable para cualquier tipo de datos, es decir, cualitativos o
cuantitativos. En todos los casos, basta con observar el dato con mayor frecuencia.
Sin embargo, para datos cuantitativos continuos agrupados en un cuadro de
frecuencias, donde se ha perdido la identidad de los datos, el valor de la
mediana solo se aproximará, es decir, solo podremos tener un valor estimado de la
mediana.
Para datos cuantitativos continuos agrupados en tablas de frecuencia, la mediana
se estima con la siguiente fórmula:
d1
mo = LIk + TICk
d1 + d2

Nota: La fórmula es la misma para Población y para Muestra. Sin embargo, para
Población usaremos el símbolo Mo y para Muestra usaremos mo.
Siendo: LIk = Límite inferior del intervalo donde se encuentra la moda.
TICk = Tamaño del intervalo de clase donde se encuentra la moda.
d1 = frecuencia máxima – frecuencia anterior
d2 = frecuencia máxima – frecuencia siguiente

Ejercicio #9
Determine la moda en cada uno de los siguientes casos.
Datos Moda(s)
3, 5, 5, 6, 7, 7, 8, 10, 12, 12, 12, 13, 14, 15, 18
9, 11, 11, 11, 13, 15, 16, 17, 17, 18, 18, 19, 19, 20
7, 8, 9, 9, 9, 10, 11, 12, 12, 12, 13, 13, 14, 15, 17, 17
35, 38, 38, 39, 40, 41, 41, 42, 43, 43, 45, 46, 48, 50, 51
19, 20, 21, 22, 24, 25, 26, 27, 29, 30, 31, 33, 34, 35

-12- Estadística para la Universidad


Medidas de Tendencia Central

Ejercicio #10
Para el ejercicio #3, estime el ingreso mensual más frecuente de los trabajadores de
la empresa.
Rpta. 2175 soles.

Características de la Moda
1. Un conjunto de datos puede no tener moda o puede tener más de una moda.
Si tiene una sola moda se llama UNIMODAL, si tiene dos modas, se llama
BIMODAL, si tiene más modas se llama MULTIMODAL.
2. Se puede observar tanto en datos cualitativos como en datos cuantitativos.
3. La moda muestral es muy inestable (variable) y por lo tanto es poco confiable.
Para datos cuantitativos:
4. La moda no se ve afectada por los valores extremos de las observaciones.
5. Tiene la misma unidad de medida que las observaciones.
6. Su valor se encuentre dentro del rango de valores de la variable.

PROPIEDAD DE LA MODA
Cuando a un conjunto de datos cuantitativos se les suma y/o se les multiplica una
cantidad constante el valor de su moda se ve afectado en la misma medida, es decir:
si yi = axi + b  Mo(y) = aMo(x) + b

Nota: Para todo conjunto de datos cuantitativos continuos agrupados en intervalos


de clase, las medidas estadísticas son solo valores aproximados del
verdadero valor, debido a que se ha perdido la identidad de los datos.

Estadística para la Universidad -13-


Medidas de Tendencia Central

4. MEDIA GEOMÉTRICA
Se utiliza para la elaboración de números índices y para la obtención de tasas de
crecimiento promedio.
La media geométrica de un conjunto de “n” datos positivos se determina de la
siguiente manera:

MG = n a1 . a2 . a3 ........ an

Uso de la media geométrica


Para un conjunto de datos de los cuales se quiere conocer su crecimiento por
períodos y además su crecimiento promedio, primero se determina el índice de
crecimiento por período.
El índice de crecimiento por período ij se obtiene dividiendo el valor actual de la
observación entre el valor de la observación del período anterior:
xj
ij = (índice del período)
x j −1

Luego, el índice promedio de crecimiento o razón promedio de crecimiento


geométrico está dado por:

iprom. = MG(i) = k i1 . i2 . i3 ...........ik (k = número de índices)

x1 x2 x3 xk xk X
Además, dado que: MG = k . . .........  MG(i) = k = k Final
x0 x1 x2 x k −1 xo X Inicial

Siendo: X0 = dato del período inicial y Xk = dato del período final.

Dado que la MG de los índices, por ser una media, tiene la propiedad de representar
a cada uno de los índices, podemos afirmar que el crecimiento geométrico promedio
o variación promedio porcentual de los datos, se obtiene a partir de:

MG(i) = 1 + tasa de crecimiento promedio (%)

-14- Estadística para la Universidad


Medidas de Tendencia Central

Ejercicio #11
Suponga que las utilidades anuales de una empresa en miles de millones de dólares
están dadas por:

Año 2001 2002 2003 2004 2005 2006


Utilidades 100 120 150 75 90 120

Determine la tasa de crecimiento promedio anual de dicha empresa. Interprete.


Rpta. 3,71%

Cambio de tasa de crecimiento:


Para cambiar de tasa de crecimiento entre períodos de evaluación, debemos tener en
cuenta que:
1 + t a = (1 + tm )12 (m: mensual); 1 + t a = (1 + t b )6 (b: bimestral)

1 + t a = (1 + t T )4 (T: trimestral); 1 + t a = (1 + t s )2 (s: semestral)

1 + t Q = (1 + t a ) 5 (Q: quinquenal); 1 + t B = (1 + t a ) 2 (B: bienal)

Ejercicio #12
Las utilidades anuales (unidades monetarias) generadas por un paquete de acciones
de la compañía DDK durante los últimos años han sido los siguientes:

2000 2001 2002 2003 2004 2005 2006 2007 2008


5 9 8 12 18 16 14 21 20

Determine la tasa trimestral de crecimiento de las utilidades durante dicho período.


Interpretar el valor hallado.
Rpta. 4,43%

Nota: La siguiente expresión nos permite estimar o proyectar un valor futuro en


base al comportamiento promedio de los datos en determinado período:

X futuro = X actual (1 + tasa del periodo ) número de períodos

Estadística para la Universidad -15-


Medidas de Tendencia Central

Donde el valor futuro es el valor del período que se quiere predecir o estimar y el
valor actual puede ser el valor inicial del período (X o) o el valor final del período
(XF).

Ejercicio #13
Suponga que una fábrica ha registrado los siguientes incrementos en su producción,
para el período 2008-2014.

Año 2009 2010 2011 2012 2013 2014


Variación
12% -8% 6,4% 3,6% 10% 1,2%
porcentual

Basados en esta información, estime la producción en abril del año 2016, si se sabe
que la producción del año 2014 fue aproximadamente 10,8 TM.
Rpta. 0,948 TM.

6. OTRAS MEDIDAS DE TENDENCIA


CUANTILES
Son valores de la variable que dividen a una distribución de datos, en dos partes.
Los cuantiles también se usan cuando la distribución se divide en varios grupos; así
por ejemplo tenemos los percentiles, los deciles, los cuartiles, los quintiles, etc.

PERCENTIL
El percentil de orden p (Pp), es el valor de la variable que divide a la distribución
en dos partes, de modo que el p% de la distribución se encuentre antes del
percentil p y el resto, el otro (100-p)% de la distribución se encuentre después
del percentil p.

p% (100 – p)%

xmin Pp xmáx

-16- Estadística para la Universidad


Medidas de Tendencia Central

Para datos cuantitativos discretos NO agrupados, pero ordenados de acuerdo


a su magnitud, un percentil se determina de la siguiente manera:
1° Halle la posición: k = (n+1).p
Siendo: n= número de datos.
p= Porcentaje acumulado del percentil.
k= Posición del percentil.
2° Identifique los elementos mediante la siguiente expresión: K = e.d
Siendo: e= Parte entera de k
d= Parte decimal de k
3° Calcule el percentil con la siguiente fórmula: Pp= Xe + 0.d [Xe+1 – Xe ]
Siendo: Xe = el dato de posición “e”

Ejercicio # 14
Es un estudio sobre los tiempos de espera en caja (en minutos), de los pacientes de
un hospital, se obtuvo los siguientes resultados para una muestra de 30 pacientes:
7,8 8,4 8,6 8,8 9,2 9,3 9,3 9,5 9,6 9,8 9,8 10,0
10,1 10,1 10,3 10,4 10,4 10,6 10,7 11,2 11,2 11,4 11,5 11,7
11,9 12,0 12,1 12,3 12,5 13,2
Determine: P10; P25; P40; P75; P80, de la distribución de los tiempos de espera.
Interprete cada uno de ellos.
Rpta. P10=8,62min; P25=9,45min; P40=10,04min; P75=11,55min; P80=11,86min.

NOTA: Este procedimiento también se puede emplear para datos cuantitativos


discretos agrupados. En este caso es recomendable obtener las frecuencias
acumuladas Fi o Pi para encontrar la posición “e”.
Para datos cuantitativos continuos organizados en cuadros de frecuencia
(intervalos de clase), se utilizan las siguientes fórmulas:
np − Fk −1
i. Para frecuencias absolutas: Pp = LIk + TICk Pp→ porcentaje acumulado
fk

p − Frk −1
ii. Para frecuencias relativas: Pp = LIk + TICk Pp→ porcentaje acumulado
frk

Estadística para la Universidad -17-


Medidas de Tendencia Central

Ejercicio #15
Para el ejercicio #3, estime el P10, P40 y el P75 de la distribución del ingreso mensual
de los trabajadores de la empresa.
Rpta. P10=850 soles; P40=1576,842 soles; P75=2369,231 soles.

DECIL
Los deciles son cuantiles agrupados cada 10%. Existen desde el decil 1 (D1 = P10)
hasta el decil 9 (D9 = P90).

D1 D2 D3 .....

A la distancia entre el decil 1 y el decil 9 se le denomina Rango Interdecílico, y


agrupa el 80% central de la distribución. RID = D 9 – D1.

CUARTIL
Los cuartiles son cuantiles agrupados cada 25%. Son tres cuartiles: Q1 = P25, Q2
= P50 = Me, Q3 = P75.

25% 25% 25% 25%

Q1 Q2 Q3
Espacio Intercuartílico

A la distancia entre el cuartil 1 y el cuartil 3 se le denomina Rango Intercuartílico, y


agrupa el 50% central de la distribución. RIQ = Q3 – Q1.

Nota: La mediana es el percentil 50 de una distribución, esto es:


Me = P50 = D5 = Q2

-18- Estadística para la Universidad


Medidas de Tendencia Central

Ejercicio #16
Para el ejercicio #3, determine el rango intercuartílico y el rango interdecílico del
ingreso mensual de los trabajadores de la empresa.
Rpta. RIQ  1144,231 soles; RID  1865,556 soles.

Características de los Percentiles


1. Tienen la misma unidad de medida que las observaciones.
2. Su valor se encuentra dentro del rango de valores de la variable.
3. No se ven afectados por los valores extremos de las observaciones.
4. A cada percentil, decil o cuartil le corresponde un único valor de observación.
5. Para cualquier distribución se tiene que: Me = P50 = D5 = Q2 .

6. Solo es aplicable para datos cuantitativos.

PROPIEDAD
Se ven afectados en la misma medida y proporción si se le suma y/o multiplica una
constante al conjunto de datos, esto es: Pp (y) = a  Pp (x) + b

Estadística para la Universidad -19-

También podría gustarte