3.5b MD (Datos Agrupados)
3.5b MD (Datos Agrupados)
3.5b MD (Datos Agrupados)
GENERALES
LETRAS
Distrito A Distrito B
Cantidad de niños
¿En qué distrito las edades de los niños son más homogéneas?
Solución propuesta
En el Distrito A
∑ ′ 122
̅ 6,1 ñ
20
1
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
∑ ′ ̅ 99,8
2,29 ñ .
20 1 19
Para el Distrio B
Hallamos la media
∑ ′ 82
̅ 4,1 ñ
20
La edad promedio de los niños en el distrito B es 4,1 años.
∑ ′ ̅ 91,8
2,20 ñ .
20 1 19
Las medidas de dispersión nos dicen cómo están agrupados los datos respecto del
promedio o valor central de la distribución, estos datos pueden estar concentrados o
dispersos en torno del promedio.
En esta sección estudiaremos el coeficiente de variación para responder este tipo de
preguntas, es decir, cuando se trabaja con datos agrupados.
Ejemplo 1
El peso mínimo y máximo de los 200 empleados de la fábrica BARKUS es 50 y 100
kilogramos (kg) respectivamente. Los pesos de los empleados se organizan en una
tabla de distribución de frecuencias de cinco intervalos de igual amplitud. Se sabe que
20 de los empleados pesan al menos 50 kg, pero menos de 60 kg; 30% de los
empleados pesan menos de 70 kg; 110 pesan menos de 80 kg; y el 10% de los
empleados tienen un peso mayor o igual a 90 kg.
A partir de la información anterior:
a) Construya la tabla de distribución de frecuencias.
b) ¿Es verdad que el 50% de los empleados de la fábrica BARKUS pesa menos de 75 kg?
Justifique su respuesta.
2
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
c) ¿Qué porcentaje de los empleados tiene pesos no menores a 70 kg? Justifique su
respuesta.
d) Estime el valor de la media aritmética y desviación estándar muestral.
Solución propuesta
Amplitud: ! 100 50 /5 luego ! 10.
a) Con los datos proporcionados, se puede construir la siguiente tabla:
Clases ′ ℎ % & ′ ′ ̅
'50; 60' 55 20 0,10 20 0,10 1100 9245,0
'60; 70' 65 40 0,20 60 0,30 2600 5290,0
'70; 80' 75 50 0,25 110 0,55 3750 112,5
'80; 90' 85 70 0,35 180 0,90 5950 5057,5
'90; 100* 95 20 0,10 200 1 1900 6845,0
Total 200 1 15300 26550
d) Media aritmética:
∑ ′ 15300
̅ 76,5 ,-
200
Desviación estándar muestral:
∑ ′ ̅ 26550
14,94 ,- .
200 1 119
Coeficiente de variación
El coeficiente de variación (C.V.) es una medida de dispersión relativa, que se define
como la desviación estándar (en este caso muestral) dividido por la media aritmética.
Es decir:
s
C.V.
x
3
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
El C.V. es libre de unidades de medida y se utiliza para comparar la variabilidad de dos
o más series de datos que tengan medias aritméticas iguales o diferentes o que tengan
unidades de medidas iguales o diferentes. A menor valor del C.V. menor variabilidad
(o mayor homogeneidad).
Ejemplo 2
Centro A
Estaturas (en cm) Número de niños
[80; 85[ 4
[85; 90[ 14
[90; 95[ 23
[95; 100[ 17
[100; 105[ 11
[105; 110] 6
Total 75
A partir de la información dada, responda lo siguiente:
a) Halle la media y la desviación estándar muestral de los datos del centro A.
b) ¿Cuál de los centros tiene mayor estatura promedio?
c) ¿En qué grupo las estaturas son más homogéneas?
Solución propuesta
a) Construimos una tabla de los datos del centro A que nos ayudará a realizar los
cálculos de la media y desviación estándar muestral.
∑ ′ ̅ 3216,6675
6,59 ./
1 74
b) Dado que en el centro B la estatura promedio de los niños es 94,56 cm, por lo
tanto, la mayor estatura promedio la tiene el centro A.
6,59
c)
01 0,0694
̅ 94,83
55,50
01 0,5869
̅ 94,56
Puesto que CVA CVB podemos concluir que en el grupo A las estaturas son más
homogéneas, es decir, los datos están menos dispersos de su media que en el
grupo B.
muestral s=2,55.
Considerando la información dada sobre las edades de los hombres y mujeres,
determine cuál es el conjunto de datos menos disperso, ¿el de los hombres o el
de las mujeres? Justifique su respuesta.
Para el criadero Brígida selecciona una muestra de 100 truchas, cuyo peso
promedio es 710,41 gramos y con desviación estándar muestral de 102,58 gramos.
4. Debido a los reclamos salariales de los médicos del MINSA, después de algunas
reuniones con el presidente de la Federación Médica del Perú, el Ministerio de
Salud acordó pagar, en el mes de noviembre, una bonificación especial a los
profesionales de la salud. El pago de esta bonificación se realizará de acuerdo una
escala establecida por el MINSA.
A continuación, se muestran las bonificaciones, en nuevos soles, que recibirán los
médicos en dos hospitales de Lima:
6
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
Hospital A
Número de
Bonificaciones
médicos
[250; 300[ 13
[300; 350[ 29
[350; 400[ 19
[400; 450[ 14
[450; 500] 5
Total 80
Si la relación de las varianzas de las ventas de las tres vendedoras es como sigue
¿De qué vendedora sus ventas fueron más dispersas? Justifique su respuesta.
1. a)F b) F c) F
2. a. Tabla de frecuencias
Frecuencia Frecuencia
Marca Cantidad de Frecuencia Frecuencia
absoluta relativa
Edades de clase hombres relativa porcentual
fi acumulada acumulada
X’i hi pi
Fi Hi
[12; 21[ 16,5 80 0,30 80 0,30 30 %
7
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
[21; 30[ 25,5 57 0,21 137 0,51 21 %
[30; 39[ 34,5 51 0,19 188 0,70 19 %
[39; 48[ 43,5 41 0,15 229 0,85 15 %
[48; 57[ 52,5 30 0,11 259 0,96 11 %
[57; 66] 61,5 11 0,04 270 1 4%
270 1 100 %
b) Edad promedio aproximada= 31,73 años.
c) No se puede calcular la moda, ni la mediana a partir de la tabla, pues se necesita
las edades de los 270 hombres.
d) Desviación estándar muestral = 13,57 años.
e) Para las mujeres: x m 31,53 y s m 2 , 55
Para los Hombres: x h 31,73 y s h 13 , 57
2,55 13,57
CV m 0,0808 CV h 0,4276
31,53 31,73
4 C : C ?
8
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
C C
4 : ?
̅ ̅ ̅
C C
4 : ?
̅4 ̅: ̅?
Se determina que:
Por lo tanto, la vendedora que tiene ventas más dispersas es Estefanía, ya que sus
ventas tienen un coeficiente de varianza mayor que las otras vendedoras.
9
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.