Medidas de Resumen-Tendencia Central

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 24

Tema III

Medidas de Resumen:
Tendencia Central
(Borrador para corrección)

Héctor Medina Disla

Santo domingo, D. N.
Febrero 2011

Hector Medina Disla. Marzo 2011 1


¿Qué son?

Las medidas de resumen representan un conjunto de medidas que permiten


describir las características principales de un conjunto de datos. Con ellas se realiza
el proceso de describir las características de una o más variables numéricas a partir
de tres tipos de medidas: tendencia central, (promedios), medidas de variabilidad o
dispersión y medida de forma.

Importancia

En los temas anteriores se han tratados los aspectos relacionados con la


organización y presentación de los datos. Ya se ha tratado y se ha visto que con
una distribución de frecuencia podemos describir el comportamiento de una
variable, también vimos que con un cuadro de doble entrada o tabulación cruzada,
podemos ver como se asociación dos o más variables. Sin embargo, en una
distribución de frecuencia se obtienen diferentes medidas, sobre todo porcentajes,
para cada una de las clases o valores de la variable se tiene un porcentaje de datos
que pertenece a esa categoría, pero también se tienen los porcentajes acumulados
hasta cierto valor de la variable.

La importancia de las medidas de resumen es que a partir de ellas se puede


caracterizar un conjunto de elementos a partir de cuatro medidas descriptivas.

Principales Medidas de Resumen

 Tendencia Central
 Variabilidad o dispersión
 Forma

Medidas de Tendencia Central

¿Qué son?

Como su nombre lo indica, las medidas de tendencia central son aquellas que
describen el centro de una variable, indican un valor alrededor del cual se agrupa la
mayoría de los valores de un conjunto de datos. La Importancia de estas medidas
es que a partir de ella se puede caracterizar un grupo poblacional. Por ejemplo si
hacemos un estudio sobre las características de los consumidores de un producto,
y nos encontramos que la edad promedio es de 30 años, podemos describir a
nuestros consumidores cono una población joven. Aunque queda claro que hay
personas con más y menos edad, pero el promedio nos da un indicador del grupo
como un todo.

Hector Medina Disla. Marzo 2011 2


Las principales medidas de tendencia central son:

 Promedio o media aritmética


 Mediana
 Moda
 Media Geométrica
 Media Armónica

El promedio o Media Aritmética, ( X )


El promedio o media aritmética es la medida de tendencia central de mayor uso en
todas las áreas, la misma representa un valor central, alrededor del cual se agrupan
la mayor parte de los valores de una variable cuantitativa. Matemáticamente, la media
aritmética es el cociente que resulta de dividir la suma de todos los valores de la
variable entre el número de elementos sumados, es decir:

X =
∑X i

n
Ejemplo: De una población de 120 supermercados se tomó una muestra de cinco
de ellos y se calculó las ventas diarias de los mismos, (ventas expresadas en
cientos de miles de RD$. Los datos son 4.1, 2.9, 2.0, 4.5, 1.5

X=
∑X i

4.1 + 2.9 + 2 .0 + 4 .5 + 1.5


X =
5
15
X = = 3 .0 $
5
Características

 Todo conjunto de datos tiene una y sola una media aritmética o promedio.
 El promedio o media aritmética no cambia significativamente cuando cambia
el tamaño de la muestra
 El promedio o media aritmética es una medida representativa de los valores
de la variable, dado que la suma de la diferencia de cada valor de la variable
menos el promedio es igual a cero, Σ(Xi – X ) = 0

 Demostración

Hector Medina Disla. Marzo 2011 3


• Σ(Xi – X ) = (4.1 – 3.0) + (2.9 – 3.0) + (2.0 – 3.0) + (4.5 – 3.0) + (1.5 – 3.0)
• Σ(Xi – X ) = 1.1+(- 0.1) + (-1) + 1.5 + (-1.5)
• Σ(Xi – X ) = 0

4. El Promedio o media aritmética es un estimador eficiente del promedio en la


población, dado que Σ(Xi – X )2 < Σ(Xi – A)2, A ≠ X

Demostración: para A = 3.5

Σ(Xi – X )2 < Σ(Xi – A)2


(4.1 – 3.0)2 = 1.21 (4.1 – 3.5)2 = 0.36
(2.9 – 3.0)2 = 0.01 (2.9 – 3.5)2 = 0.36
(2.0 – 3.0)2 = 1.00 (2.0 – 3.5)2 = 2.25
(4.5 – 3.0)2 = 2.25 (4.5 – 3.5)2 = 1.00
(1.5 – 3.0)2 = 2.25 (1.5 – 3.5)2 = 4.00
Suma = 6.72 < Suma = 7.92

En esencia esta característica lo que indica es que el menor grado de dispersión


que se puede obtener en un conjunto de datos es aquel calculado a partir del
promedio

5. Con el promedio estimado a partir de una muestra se puede estimar el total de


unidades en la población.

Total = N × X

Para nuestro ejemplo si tenemos una población de 120 supermercados, la venta


total es:

Ventas Total = 120 × 3 = 360 RD$

6. Es la única medida de tendencia central que soporta un proceso de inferencia


estadística

 Principales desventajas

1. Solo se aplica en variables cuantitativas


2. El Valor del promedio es afectado por valores atípicos, (muy grandes o muy
pequeños) en los extremos.
3. Su uso no es apropiado en distribuciones asimétricas o sesgadas

Cálculo del promedio en datos agrupados

Hector Medina Disla. Marzo 2011 4


En datos agrupados el promedio se obtiene a partir de la siguiente fórmula

X =
∑X i × fi
n

( X 1 × f1 ) + ( X 2 × f 2 ) + .... + ( X n × f n )
X =
n

Xi: representa cada valor de la variable


fi : frecuencia absoluta simple de cada valor

Ejemplo: Con el objetivo de medir el nivel de satisfacción de los usuarios de un


servicio, se tomó una muestra de una hora durante 25 días y se anotó número de
quejas recibidas en una estación de servicio al cliente.

0, 1, 0, 2, 1, 5, 3, 0, 5, 1, 0, 0, 4, 4, 0, 0, 2, 0, 2, 3, 5, 0, 1, 5, 4

Como se observa, el cero se repite nueve veces, el uno cuatro veces, el dos tres
veces, el tres dos veces, el cuatro tres veces y el cinco cuatro veces, luego el
promedio es:

X =
∑X i × fi
n

(0 × 9) + (1 × 4) + (2 × 3) + (3 × 2) + (4 × 3) + (5 × 4)
X =
25

48
X = = 1 . 92 quejas
25

Resulta más claro si se organizan los datos en una distribución de frecuencia.


Como los datos son discretos y el rango de la variable es menor de 10 los datos se
pueden agrupar en una distribución de frecuencia simple

RV= 5 – 0
RV= 5

Hector Medina Disla. Marzo 2011 5


Número
de quejas fi
(Xi)
0 9
1 4
2 3
3 2
4 3
5 4
Total 25

Los pasos para obtener el promedio a partir de datos agrupados en una distribución
de frecuencia simple son:

1) Determinar la frecuencia de cada valor de la variable


2) Multiplicar cada valor de la variable por su respectiva frecuencia
3) Sumar el producto de cada valor por su frecuencia
4) Dividir el resultado de la suma entre la suma de la frecuencia.

Número
de quejas fi
(Xi) Xi × fi
0 9 0
1 4 4
2 3 6
3 2 6
4 3 12
5 4 20
Total 25 48

X =
∑ (X i × fi )
n

48
X = = 1 .92 quejas
25

Cuando los datos están agrupados en una distribución de frecuencia con clases, no
se tiene un valor único de la variable, sino que se dispone de un rango de valores,
por lo que el valor de la variable, Xi, se representa por el punto medio o marca de
clase, el cual se obtiene sumando el límite inferior y límite superior de cada clase y
este resultado dividido entre dos.

Hector Medina Disla. Marzo 2011 6


Si llamamos Xi al punto medio de cada clase, Li al límite inferior de la clase y Ls al
límite superior de la clase, el punto medio de cada clase está dado por:

Li + Ls
X i =
2
Los pasos para obtener el promedio a partir de datos agrupados en una distribución
de frecuencia con clase son:

1) Calcular el punto medio de cada clase


2) Multiplicar cada valor del punto medio por su respectiva frecuencia
3) Sumar el producto de cada punto medio por su frecuencia
4) Dividir el resultado de la suma entre la suma de la frecuencia

Ejemplo: Se analizó el registro del número de pacientes atendidos durante una


semana por 30 médicos de un hospital

Número de
fi
pacientes
22 – 34 7
34 – 46 4
46 – 58 5
58 – 70 5
70 – 82 6
82 – 94 3
Total 30

El primer paso es calcular el punto medio de cada una de las clases de la


distribución

22 + 34 34 + 46 46 + 58
X1 = = 28 X 2 = = 40 X 3 = = 52
2 2 2

58 + 70 70 + 82 82 + 94
X 4 = = 64 X 5 = = 76 X 6 = = 88
2 2 2

Luego de calculado los puntos medios en cada clase lo colocamos en la tabla y


estos valores va a representar al valor de la variable en cada una de las clases
como se muestra en la columna tres de la tabla siguiente

Hector Medina Disla. Marzo 2011 7


Número de (2) (3)
pacientes fi Xi
22 – 34 7 28
34 – 46 4 40
46 – 58 5 52
58 – 70 5 64
70 – 82 6 76
82 – 94 3 88
Total 30

El siguiente paso consiste en multiplicar cada valor del punto medio por su
respectiva frecuencia, como se muestra en la columna cuatro de la tabla siguiente.

Número
(2) (3) (4) = 2 × 3
de
fi Xi Xi × f i
pacientes
22 – 34 7 28 196
34 – 46 4 40 160
46 – 58 5 52 260
58 – 70 5 64 320
70 – 82 6 76 452
82 – 94 3 88 264
Total 30 1,652

Luego de realizada la multiplicación, se procede a realizar la suma y luego la


división

X =
∑ (X i × fi )
=
1, 652
= 55 . 1 pacientes
n 30

La Mediana
La mediana es una medida de posición que divide la variable en dos partes iguales,
de forma que la mitad de los elementos se quedan por debajo de la mediana y la
otra mitad por encima de esta. Su principal uso es en aquellas variables que cuyo
comportamiento sigue una distribución no simétrica o en distribuciones de
frecuencia con clases abiertas.

Características

Hector Medina Disla. Marzo 2011 8


 Todo conjunto de datos tiene una solo una mediana
 Su valor no se ve afectado por la presencia de valores atípicos.
 Se puede utilizar en datos agrupados en distribuciones de frecuencia con
clases abiertas.
 Se puede utilizar en datos cualitativos, cuando estos están expresados en
una escalar ordinal.
 Su valor cambia cuando cambia el tamaño de la muestra
(n + 1)
OM =
Procedimiento de cálculo: Datos sueltos 2

1. Ordenar los datos en orden ascendente


(n + 1)
2. Calcular el orden de la mediana, OM =
2
3. Ubicar el valor de la mediana

Ejemplo: Con los datos referentes al número de quejas recibidas en la estación de


servicios,

0, 1, 0, 4, 2, 1, 5, 3, 0, 5, 1, 0, 0, 4, 4, 0, 0, 2, 0, 2, 3, 5, 0, 1, 5.

La mediana se obtiene siguiendo los tres pasos enumerados

1. Ordenando los datos:

0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 5, 5, 5, 5

2. Orden de la mediana

(n + 1)
OM =
2

(25 + 1)
OM =
2

26
OM = = 13
2

3. Se ubica la posición 13 en el conjunto ordenado de datos y se muestra que la


mediana es igual a una queja,

Me = 1 queja.

Hector Medina Disla. Marzo 2011 9


Si se agruparan los datos, el procedimiento se simplifica

Número de
fi
quejas (xi)
0 9
1 4
2 3
3 2
4 3
5 4
Total 25

Para encontrar el valor de la mediana se busca en la Frecuencia Acumulada el


primer valor que sea mayor o igual al orden de la mediana y el valor de la variable a
que corresponda esta frecuencia es el valor de la Mediana.

Número de
fi FA
quejas (xi)
0 9 9
1 4 13
2 3 16
3 2 18
4 3 21
5 4 25
Total 25

El orden de la mediana se obtiene con igual procedimiento que con los datos
simples, es decir,

(n + 1)
OM =
2

(25 + 1)
OM =
2

26
OM = = 13
2

En este caso el primer valor de la Frecuencia Acumulada mayor o igual al orden es


13 y corresponde al valor al segundo valor de la variable es decir uno, luego la
mediana es

Me= 1 queja

Hector Medina Disla. Marzo 2011 10


En el caso de los datos estén agrupados en una distribución de frecuencia con
clase, la medina se obtiene a partir de la siguiente fórmula:

 OM − FA−1 
M e = Li +  × I 
 fm 

 Me: Mediana
 Li : Límite inferior de la clase que contiene a la mediana
 OM : Orden de la mediana
 FA-1: Frecuencia acumulada hasta la clase anterior a la clase de la mediana.
 fm: Frecuencia absoluta simple de la clase que contiene a la mediana
 I: Intervalo de la clase de la mediana

Ejemplo: con los datos referentes al número de pacientes atendidos por 30


médicos

Número de
fi
pacientes
22 – 34 7
34 – 46 4
46 – 58 5
58 – 70 5
70 – 82 6
82 – 94 3
Total 30

El primer paso consiste en obtener la frecuencia acumulada y determinar cual es la


clase que contiene a la mediana. Para ello calculamos el orden de la mediana, OM

Número de
fi FA
pacientes
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30

Hector Medina Disla. Marzo 2011 11


(n + 1)
OM =
2
(30 + 1)
OM =
2
31
OM = = 15.5
2

Para saber cual es la clase que contiene a la mediana se busca en la frecuencia


acumulada el primer valor que sea mayor o igual al orden de la mediana y la clase a
que corresponda esta frecuencia es la clase de a la mediana. En este caso el
primer valor de la frecuencia acumulada mayor o igual al 15.5 es 16 y corresponde
a la tercera clase, (46 – 58), esta es la clase de la mediana.

A partir de esta información se tienen los datos necesarios para determinar el valor
de la mediana

Li = 46
OM = 15.5
FA-1 = 11
fi = 5
I = 12

 OM − FA−1 
M e = Li +  × I 
 fm 

Luego, sustituyendo:

 15.5 − 11 
M e = 46 +  ×12 , realizando los cálculos
 5 
Me = 46 + 10.8

Me ≈ 57 pacientes

Interpretación de la mediana:

Como la mediana divide al conjunto de datos en dos partes iguales, se puede decir
en que la mitad de los médicos atienden menos de 57 pacientes a la semana y la
otra mitad atiende a por encima de esta cantidad.

Hector Medina Disla. Marzo 2011 12


La Moda, (Mo)
La moda se define como el valor o atributo que más se repite en un conjunto de
datos. La Moda no es una medida que aporte mucha información, por lo tanto su
uso es bien limitado. Su mayor aplicación es cuando se trabajan datos cualitativos.
Por ejemplo en datos continuos es resulta un tanto difícil encontrar un valor modal,
pues estos se pueden diferenciar por una milésima.

Como se muestra en el siguiente conjunto de datos que indica el diámetro de un


centro de bobina, a pesar de tener una muestra de 36 dispositivos, no hay un solo
valor que se repita, todos difieren de los demás, en ese sentido no hay un valor
modal y no se podría describir dicho conjunto de datos a partir de esta medida.

Tabla 1: Diámetro del centro de una bobina


2.356 2.412 2.407 2.328 2.434 2.288
2.432 2.390 2.337 2.355 2.412 2.398
2.379 2.474 2.368 2.326 2.400 2.304
2.305 2.407 2.333 2.327 2.373 2.323
2.399 2.430 2.433 2.334 2.381 2.320
2.431 2.430 2.386 2.382 2.389 2.384

Características y desventajas de la Moda

 Es una medida que se aplica tanto a datos cuantitativos como para datos
cualitativos.
 Su valor no es afectado por valores atípicos en los extremos
 Su valor no está definido algebraicamente
 En un conjunto de datos puede existir más de una muestra y es posible
también que no haya moda.
 Si un conjunto de datos tiene una sola moda, se le denomina unimodal, si
tiene dos modas se le denomina bimodal y tiene tres o más se le denomina
multimodal.

Ejemplo: Con los datos referentes al número de quejas recibidas en la estación de


servicios, la moda se obtiene determinando el valor que más se repite en el
conjunto de datos.

0, 1, 0, 4, 2, 1, 5, 3, 0, 5, 1, 0, 0, 4, 4, 0, 0, 2, 0, 2, 3, 5, 0, 1, 5,

Como se observa en los datos, el valor que más se repite es el cero, por tanto, para
este conjunto de datos, la moda está dada por:

Mo = 0 quejas

Hector Medina Disla. Marzo 2011 13


En el caso de los datos estén agrupados en una distribución de frecuencia con
clase, La Moda se obtiene a partir de la siguiente fórmula:

 ∆1 
M o = Li +  × I 
 ∆1 + ∆ 2 
Donde:

Mo: Moda
Li : Límite inferior de la clase modal
∆1: Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior
a ésta
∆2 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior a ésta
I : Intervalo de la clase modal

Ejemplo: con los datos referentes al número de pacientes atendidos por 30


médicos

Número de
pacientes fi
22 – 34 7
34 – 46 4
46 – 58 5
58 – 70 5
70 – 82 6
82 – 94 3
Total 30

La clase modal es la clase que tiene mayor frecuencia absoluta simple. En este caso
la clase modal es la primera, cuya frecuencia absoluta es siete. De ahí se obtienen
los siguientes datos:

Li = 22
∆1 = 7 – 0 = 7
∆2 = 7 – 4 = 3
I = 12,

 7 
Sustituyendo: M o = 22 +  ×I
7+3 

Mo= 22 + 8.4,

Mo ≈ 30 pacientes

Hector Medina Disla. Marzo 2011 14


Medidas de Posición o de Localización: Los Cuantiles

¿Qué son?

Son medidas de localización similares a las de tendencia central, solo que estas no
necesariamente describen el centro de una variable, sino que describen una medida en
una posición determinada. Por ejemplo, con estas medidas podemos saber cual es el valor
por debajo del cual se encuentra un porcentaje determinado, igual podemos saber, por
ejemplo, cual es el valor mínimo que garantiza un porcentaje determinado por encima o
por debajo de un valor. Estas medidas se les denominan CUANTILES (Q) y su función es
informar del valor de la variable que ocupará la posición (en tanto por ciento) que nos
interese respecto de todo el conjunto de variables.

Podemos decir que los Cuantiles son unas medidas de posición que dividen a una variable
o conjunto de datos en partes iguales, de manera que en cada una de ellas contiene el
mismo número de los elementos de una población

Importancia

Las medidas de posición proporcionan información sobre el conjunto de datos que se


está analizando. Esta descripción de los datos, incluye como un elemento de
importancia la ubicación de éstos dentro de un contexto de valores posible.

Principales Medidas de Posición

CUARTILES, dividen a la distribución en cuatro partes iguales (tres divisiones). Q1, Q2 y


Q3, correspondientes a 25.0%, 50.0% y 75.0%.

DECILES, dividen a la variable en 10 partes iguales (9 divisiones). D1, D2..., D9,


correspondientes a un 10.0%, 20.0%,..., 90.0%

PERCENTILES, Estas medidas dividen a la distribución en 100 partes (99 divisiones). P1,
P2,..., P99, correspondientes a 1.0%, 2.0%,..., 99.0%.

Cuartiles

Los cuartiles, (Qk) son medidas que dividen a la variable en cuatro partes iguales,
de forma tal que la cada cuartel representa un 25.0% de los datos. Para calcular
estas medidas se sigue el mismo procedimiento que el utilizado para calcular la
mediana, de hecho, el cuartil dos (Q2) es igual a la mediana, de forma tal que en
datos sueltos, el procedimiento de cálculo sigue tres pasos

Hector Medina Disla. Marzo 2011 15


1. Ordenar los datos en orden ascendente

2. Calcular el orden del cuartil,

k × (n + 1)
OQk =
n

3. Ubicar en los datos ordenados el valor del cuartil k

Ejemplo: Los datos que se muestran a continuación representan nivel de motivación


de un grupo de 20 empleados, calcular e interpretar, Q1, y Q3

70, 81, 60, 70, 71, 75, 83, 90, 85, 65, 50, 80, 74, 90, 81, 83, 85, 82, 91, 76

Ordenando los datos

50, 60, 65, 70, 70, 71, 74, 75, 76, 80, 81, 81, 82, 83, 83, 85, 85, 90, 90, 91

Orden del cuartel uno,

(n + 1)
OQ1 =
4

20 + 1
OQ1 =
4

21
OQ1 = = 5.25
4

Para encontrar la posición del Q1, se redondea el orden del cuartil al entero
siguiente, en este caso a seis. Luego el valor del Q1 sería el valor que se encuentra
en la posición 6, en este caso, 71, por lo que

Q1= 71 puntos

Este resultado indica que el 25.0% de los empleados tiene un nivel de motivación
por debajo de 71 puntos.

Para el cálculo del cuartel 3, (Q3) se procede de la misma manera

3 × (n + 1)
OQ3 = ,
4

Hector Medina Disla. Marzo 2011 16


3 × (20 + 1)
OQ3 =
4

63
OQ3 = = 15.75 , redondeando al entero siguiente OQ3= 16
4

El valor del Q3 es el valor que se encuentra en la posición 16 del conjunto de datos


ordenados, es decir,

Q3= 85 puntos

Este resultado indica que el 75.0% de los empleados tiene un nivel de motivación
por debajo de 85 puntos. También se puede decir que la puntuación 85 es el valor
que limita el rango percentilar del 75.0%

Percentiles

Los Percentiles, (Pk) dividen la variable en 100 partes iguales, por lo que cada
percentil representa un 1.0% de los datos. El procedimiento para el cálculo es el
mismo que el utilizado por los cuartiles:

1. Ordenar los datos en orden ascendente

2. Calcular el orden del percentil

k × (n + 1)
OPk =
100

3. Ubicar el valor del percentil k en el conjunto de datos ordenados

Ejemplo: con los datos referentes al nivel de motivación de 20 empleados, calcular


e interpretar el percentil 35.

Para el cálculo del P35 calcular el orden percentil deseado, en este caso 35. (se
obvia el paso de ordenar los datos, dado que estos ya lo estaban)

Datos ordenados:

50, 60, 65, 70, 70, 71, 74, 75, 76, 80, 81, 81, 82, 83, 83, 85, 85, 90, 90, 91

Orden P35, es

Hector Medina Disla. Marzo 2011 17


35 × (n + 1)
OP35 =
100

35(20 + 1)
OP35 =
100

735
OP35 = = 7.35
100

Redondeando al entero siguiente el orden del percentil, OP35 = 8, por lo que el valor
del P35 es el que se encuentra en la posición 8, para el ejemplo, este valor es 75,
luego

P35 = 75 puntos
Este resultado indica que el 35.0% de los empleados tiene un nivel de motivación
por debajo de 75 puntos.

Cálculo de cuartiles y percentiles en datos agrupados.

Para el cálculo de los cuartiles y percentiles en datos agrupados, se utiliza la misma


fórmula que para la mediana, esto es:

 OQK − FA−1 
Para un cuartil k, Qk = Li +  × I 
 fk 

Ejemplo: con los datos referentes al número de pacientes atendidos por 30


médicos calcular el cuartil tres y el percentil 90.

Número de
fi FA
pacientes
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30

Hector Medina Disla. Marzo 2011 18


Para el cuartil tres, buscamos el orden de dicha medida

3 × ( n + 1)
OQ 3 =
4

3 × (30 + 1)
OQ 3 =
4

3 × 31 93
OQ 3 = = = 23 .25
4 4

Para saber cual es la clase que contiene al cuartil tres, Q3 se busca en la frecuencia
acumulada el primer valor que sea mayor o igual al orden del Q3 y la clase a que
corresponda esta frecuencia es la clase del la medida buscada

Número de
pacientes fi FA
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30

En este caso el primer valor de la frecuencia acumulada mayor o igual al 23.25 es


27 y corresponde a la quinta clase, (70 – 82), esta es la clase del Q3. Luego se
tienen los siguientes datos:

Li = 70
OQ3 = 23.25
FA-1 = 21
fi = 6
I = 12

 OQ3 − FA−1 
Q3 = Li +  × I 
 f3 

Sustituyendo:

Hector Medina Disla. Marzo 2011 19


 23.25 − 21 
Q3 = 70 +  × 12 
 6 

Q3 = 70 + 4.5

Q3 ≈ 75 pacientes

Este resultado indica que el 75.0% de los médicos atiende menos de 75 pacientes a
la semana.

Cálculo del percentil 90

Para el percentil 90, buscamos el orden de dicha medida

90 × ( n + 1)
OP90 =
100
90 × (30 + 1)
OP90 =
100
90 × 31
OP90 =
100

2,790
OP90 = = 27 .90
100

Para saber cual es la clase que contiene el percentil 35, P35 se busca en la
frecuencia acumulada el primer valor que sea mayor o igual al orden del P35 y la
clase a que corresponda esta frecuencia es la clase del percentil buscado

Número de
pacientes fi FA
22 – 34 7 7
34 – 46 4 11
46 – 58 5 16
58 – 70 5 21
70 – 82 6 27
82 – 94 3 30
Total 30

Hector Medina Disla. Marzo 2011 20


En este caso el primer valor de la frecuencia acumulada mayor o igual al 27.90 es
30 y corresponde a la sexta clase, (82 – 94), esta es la clase del percentil 35, P35.

Luego se tienen los siguientes datos:

Li = 82
OP90 = 27.90
FA-1 = 27
fi = 3
I = 12

 OP − FA−1 
P90 = Li +  90 ×I
 fp 
 

Sustituyendo:

 27.90 − 27 
P90 = 82 +  × 12 
 3 
P90 = 82 + 3.6

P90 ≈ 86 pacientes

Este resultado indica que el 90.0% de los médicos atiende menos de 86 pacientes a
la semana. Equivale a decir que el 10.0% de los médicos que más atienden
pacientes consultan más de 86 personas por semana.

Hector Medina Disla. Marzo 2011 21


Ejercicios propuestos

1. Calcular e interpretar el promedio, la mediana, la moda y el percentil 75 del


siguiente conjunto de datos que muestra la viscosidad de un tipo de aceite
utilizado para refinar combustibles

52.0 52.1 52.0 51.0 51.5 51.3 52.4 50.1


53.4 49.5 54.1 50.0 49.5 52.2 49.6 49.7
52.4 50.1 49.6 49.7 49.8 50.8 49.8 50.8

2. Los datos que se muestran a continuación indican el diámetro de un centro de


bobina.

2.356 2.412 2.407 2.328 2.434 2.288


2.432 2.390 2.337 2.355 2.412 2.398
2.379 2.474 2.368 2.326 2.400 2.304
2.305 2.407 2.333 2.327 2.373 2.323
2.399 2.430 2.433 2.334 2.381 2.320
2.431 2.430 2.386 2.382 2.389 2.384

Calcular e interpretar

a) el promedio de los diámetros


b) la mediana
c) la moda
d) el percentil 90

3. El salario diario pagado por una empresa a un grupo de empleados es como sigue

284.9 292.7 295.1 295.6 296.3


289.9 279.9 293.8 300.6 294.8

a) Calcular la media aritmética o promedio del salario.


b) Calcular la mediana e interpretar su resultado
c) Si una personas se ve en la necesidad de emplear a 50 empelados de estos,
cuanto sería el pago total de los 50 empleados

4. Los pesos en gramos de cierto producto agrícola, han sido anotados, así como la
frecuencia de presentación en un cierto lote del producto.

Pesos 50 54 58 62 66 70 74 78 82
Frecuencia 6 11 16 28 46 30 21 14 8

1) Calcular la media aritmética y la mediana de los pesos.

Hector Medina Disla. Marzo 2011 22


2) Calcular el percentil 90 e interpretarlo
3) Haga un breve resumen en forma de informe donde usted informa a la gerencia
sobre las características descriptivas de esta variable. (no mas de 8 líneas)

5. La gerencia de su empresa desea lanzar un nuevo producto al mercado, antes de


hacerlo investiga sobre el salario de la población, esto para saber como es el ingreso
y la posibilidad de que dicha población pueda adquirir el nuevo producto. La tabla
adjunta muestra el salario mensual de los 720 personas encuestas:

Salarios
2.5 2.7 3.3 3.8 4.3 4.8
(en miles)
Nº de
150 101 52 31 22 14
personas

1) Haga un breve resumen en forma de informe donde usted informe a la gerencia


sobre las características descriptivas de esta población.

6. Los datos que se presentan a continuación indican el nivel de depresión de 16


empleados. Calcular e interpretar

1) el cuartil tres, percentil 90 y percentil 95.


2) el nivel de depresión promedio de los empleados

43.8 36.3 58.8 58.8 40.0 43.8 27.5 31.3


27.5 60.0 32.5 35.0 28.8 42.5 65.5 52.5

7. Se aplicó una batería de cuatro pruebas a 10 aspirantes a un puesto de trabajo.


Las puntuaciones obtenidas por los aspirantes se muestran a continuación

Sujeto Prueba I Prueba II Prueba III Prueba IV


1 122 121 96 89
2 108 115 98 78
3 120 115 95 90
4 118 117 93 95
5 113 102 109 109
6 112 96 90 88
7 109 129 102 108
8 112 119 106 105
9 115 101 95 88
10 111 95 95 84

a) Determine los percentiles 75, 90.0 y 95.0


b) Indique cuales individuos se ubican en estos rangos percentilares en cada
prueba
c) Si usted fuera a seleccionar tres sujetos de estos 10, a cuales seleccionaría.

Hector Medina Disla. Marzo 2011 23


d) Elabore un informe de no más de ocho líneas analizando los individuos más
sobresalientes en cada una de las pruebas.

8. De una población de 3,000 familias se tomó una muestra de 50 familias y se determinó


el ingreso de cada una de ella.

a) Calcular el ingreso promedio de la población.


b) Estimar el ingreso total de la población
c) Determinar el ingreso promedio del 20.0% de las familias con mayores ingresos
d) Determinar que porcentaje representa este ingreso con respecto al ingreso total de la
población

11.7 3.0 26.0 6.1 14.0 4.9 5.8 3.6 3.6 4.0
6.0 3.3 3.0 3.1 3.1 3.0 4.9 3.0 17.0 4.1
4.6 3.0 5.2 13.0 3.6 7.0 5.0 8.0 4.2 4.7
4.1 3.0 18.0 3.6 3.0 7.0 10.5 8.0 3.0 3.0
3.2 3.0 8.0 9.5 3.1 4.2 9.5 8.0 3.0 3.0

9. Un administrador ha medido seis factores importantes para el clima laboral de las


organizaciones en 15 empleados. Los factores evaluados son: integración, apoyo,
organización, relación, comunicación y cooperación.

Integración Apoyo Organización Relación Comunicación Cooperación


7.5 7.7 3.3 7.6 9.0 8.3
7.9 9.7 9.3 9.8 10.0 8.0
7.6 8.3 9.0 10.0 10.0 7.0
7.9 7.5 6.3 9.6 8.0 7.7
4.1 4.8 6.7 10.0 10.0 7.0
6.4 7.3 7.7 8.6 8.0 5.3
6.5 8.0 6.3 8.6 7.0 7.0
8.0 8.5 4.0 9.2 9.0 6.3
6.8 6.8 6.0 8.6 10.0 8.7
6.0 7.7 6.3 6.8 10.0 7.7
7.3 8.5 8.0 9.4 3.0 8.7
6.5 6.5 4.7 7.6 8.0 8.0
7.9 7.7 6.7 9.4 7.0 7.7
7.1 7.5 4.7 10.0 10.0 10.0
7.3 8.5 4.0 10.0 10.0 8.3

a) Determine el promedio y la mediana de cada una de los factores


b) Calcular los percentiles del 80, 90.0 y 95.0%.
c) Indique cuales individuos se ubican en estos rangos percentilares en cada
prueba
d) Elabore un informe de no más de ocho líneas analizando los individuos más
sobresalientes en cada una de los factores.

Hector Medina Disla. Marzo 2011 24

También podría gustarte