3.5b MD (Datos Agrupados)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 9

ESTUDIOS

GENERALES
LETRAS

3.5b Medidas de dispersión para datos agrupados


Exploremos:
Se tienen los histogramas de dos muestras de niños que son beneficiados con el
Programa del Vaso de Leche, en dos distritos de Lima.

Distribución de niños según edad

Distrito A Distrito B
Cantidad de niños

Edad en años Edad en años

¿En qué distrito las edades de los niños son más homogéneas?

Solución propuesta
En el Distrito A

EDAD (en años) fi ′ ′ ′ ̅


[0; 2[ 1 1 1 26,01
[2; 4[ 3 3 9 28,83
[4; 6[ 4 5 20 4,84
[6; 8[ 8 7 56 6,48
[8; 10] 4 9 36 33,64
Total 20 122 99,8

Hallamos la edad promedio de los niños y la desviación estándar muestral, en el


distrito A

∑ ′ 122
̅ 6,1 ñ
20

1
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
∑ ′ ̅ 99,8
2,29 ñ .
20 1 19

Para el Distrio B

EDAD (en años) fi ′ ′ ′ ̅


[0; 2[ 3 1 3 28,83
[2; 4[ 8 3 24 9,68
[4; 6[ 5 5 25 4,05
[6; 8[ 3 7 21 25,23
[8; 10] 1 9 9 24,01
Total 20 82 91,8

Hallamos la media
∑ ′ 82
̅ 4,1 ñ
20
La edad promedio de los niños en el distrito B es 4,1 años.

∑ ′ ̅ 91,8
2,20 ñ .
20 1 19

Las medidas de dispersión nos dicen cómo están agrupados los datos respecto del
promedio o valor central de la distribución, estos datos pueden estar concentrados o
dispersos en torno del promedio.
En esta sección estudiaremos el coeficiente de variación para responder este tipo de
preguntas, es decir, cuando se trabaja con datos agrupados.

Ejemplo 1
El peso mínimo y máximo de los 200 empleados de la fábrica BARKUS es 50 y 100
kilogramos (kg) respectivamente. Los pesos de los empleados se organizan en una
tabla de distribución de frecuencias de cinco intervalos de igual amplitud. Se sabe que
20 de los empleados pesan al menos 50 kg, pero menos de 60 kg; 30% de los
empleados pesan menos de 70 kg; 110 pesan menos de 80 kg; y el 10% de los
empleados tienen un peso mayor o igual a 90 kg.
A partir de la información anterior:
a) Construya la tabla de distribución de frecuencias.
b) ¿Es verdad que el 50% de los empleados de la fábrica BARKUS pesa menos de 75 kg?
Justifique su respuesta.
2
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
c) ¿Qué porcentaje de los empleados tiene pesos no menores a 70 kg? Justifique su
respuesta.
d) Estime el valor de la media aritmética y desviación estándar muestral.

Solución propuesta
Amplitud: ! 100 50 /5 luego ! 10.
a) Con los datos proporcionados, se puede construir la siguiente tabla:

Clases ′ ℎ % & ′ ′ ̅
'50; 60' 55 20 0,10 20 0,10 1100 9245,0
'60; 70' 65 40 0,20 60 0,30 2600 5290,0
'70; 80' 75 50 0,25 110 0,55 3750 112,5
'80; 90' 85 70 0,35 180 0,90 5950 5057,5
'90; 100* 95 20 0,10 200 1 1900 6845,0
Total 200 1 15300 26550

b) No se puede afirmar que el 50% de los empleados pesen menos de 75 kg porque en


el intervalos [70; 80[podrían ser todos los datos mayores que 75 kg luego no se
cumpliría la afirmación.

c) Con ayuda de la tabla mostrada anteriormente, el 70% de los empleados tienen un


peso no menor de 70 kg, es lo mismo que decir que tengan un peso de 70 kg o más.

d) Media aritmética:
∑ ′ 15300
̅ 76,5 ,-
200
Desviación estándar muestral:

∑ ′ ̅ 26550
14,94 ,- .
200 1 119

Coeficiente de variación
El coeficiente de variación (C.V.) es una medida de dispersión relativa, que se define
como la desviación estándar (en este caso muestral) dividido por la media aritmética.
Es decir:
s
C.V. 
x

3
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
El C.V. es libre de unidades de medida y se utiliza para comparar la variabilidad de dos
o más series de datos que tengan medias aritméticas iguales o diferentes o que tengan
unidades de medidas iguales o diferentes. A menor valor del C.V. menor variabilidad
(o mayor homogeneidad).
Ejemplo 2

En dos centros de salud, de distintos niveles socioeconómicos, se miden las estaturas


de los niños atendidos en la última semana. En el centro B, la estatura promedio de los
niños es 94,56 cm y la desviación estándar muestral es 55,50 cm. En el centro A se
obtuvieron los datos son los siguientes:

Centro A
Estaturas (en cm) Número de niños
[80; 85[ 4
[85; 90[ 14
[90; 95[ 23
[95; 100[ 17
[100; 105[ 11
[105; 110] 6
Total 75
A partir de la información dada, responda lo siguiente:
a) Halle la media y la desviación estándar muestral de los datos del centro A.
b) ¿Cuál de los centros tiene mayor estatura promedio?
c) ¿En qué grupo las estaturas son más homogéneas?

Solución propuesta
a) Construimos una tabla de los datos del centro A que nos ayudará a realizar los
cálculos de la media y desviación estándar muestral.

Estaturas (en cm) fi ′ ′ ′ ̅


[80; 85[ 4 82,5 330 608,1156
[85; 90[ 14 87,5 1225 752,2046
[90; 95[ 23 92,5 2127,5 124,8647
[95; 100[ 17 97,5 1657,5 121,1913
[100; 105] 11 102,5 1127,5 647,1179
[105; 110] 6 107,5 645 963,1734
Total 75 7112,5 3216,6675
Media:
∑ ′ 7112,5
̅ 94,83 ./
75
4
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
En el centro A, la estatura promedio de los niños es 94,83 cm

Desviación estándar muestral:

∑ ′ ̅ 3216,6675
6,59 ./
1 74

b) Dado que en el centro B la estatura promedio de los niños es 94,56 cm, por lo
tanto, la mayor estatura promedio la tiene el centro A.

6,59
c)
01 0,0694
̅ 94,83

55,50
01 0,5869
̅ 94,56

Puesto que CVA  CVB podemos concluir que en el grupo A las estaturas son más
homogéneas, es decir, los datos están menos dispersos de su media que en el
grupo B.

Para practicar 3.5b


1. Analice el valor de verdad de las afirmaciones, justificando su respuesta:

a) Las medidas de dispersión permiten que se reconozca el valor central de una


determinada muestra o población.
b) Mayor homogeneidad de los datos significa mayor coeficiente de variación.
c) El coeficiente de variación puede salir con signo negativo.

2. Estefanía, una estudiante de Psicología, está realizando una investigación sobre el


impacto que tiene la adicción a los juegos de celulares en hombres y mujeres. Para
ello, aplicó una encuesta en una muestra de 540 personas. A continuación, se
muestra información sobre las edades de los hombres encuestados:

Edades Cantidad de hombres


[12; 21[ 80
[21; 30[ 57
[30; 39[ 51
[39; 48[ 41
[48; 57[ 30
[57; 66] 11
270

A partir de la información mostrada en la tabla, realice lo siguiente:


5
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
a) Construya la tabla de distribución de frecuencias.
b) Estime la edad promedio de los hombres encuestados.
c) ¿Se puede calcular la mediana y la moda para los datos presentados en la
tabla? Justifique.
d) Estime la desviación estándar de los datos.

obtuvo la siguiente información, en años: Media x3=31,53 y desviación estándar


e) Por otro lado, sobre las edades de las 270 mujeres encuestadas, Estefanía

muestral s=2,55.
Considerando la información dada sobre las edades de los hombres y mujeres,
determine cuál es el conjunto de datos menos disperso, ¿el de los hombres o el
de las mujeres? Justifique su respuesta.

3. Victoria es dueña de tres criaderos de truchas: Artemisa, Brígida y Ceres. Ella


selecciona una muestra de cada criadero para analizar el peso de las truchas.
Para el criadero Artemisa selecciona una muestra de 90
truchas, cuyos pesos se muestran a continuación:
P eso en gramos Núme ro d e truchas
[50 0 - 600[ 15
[60 0 - 700[ 30
[70 0 - 800[ 27
[8 00 – 9 00] 18
Tot al 90

Para el criadero Brígida selecciona una muestra de 100 truchas, cuyo peso
promedio es 710,41 gramos y con desviación estándar muestral de 102,58 gramos.

Teniendo en cuenta la información brindada:


a) Estime el peso promedio de las truchas y la desviación estándar del peso de
las truchas para la muestra del criadero Artemisa.
b) Considerando los criaderos Artemisa y Brígida, ¿En cuál de las dos muestras
tiene mayor peso promedio? ¿En qué muestra los pesos son más
homogéneos? Justifique su respuesta.

4. Debido a los reclamos salariales de los médicos del MINSA, después de algunas
reuniones con el presidente de la Federación Médica del Perú, el Ministerio de
Salud acordó pagar, en el mes de noviembre, una bonificación especial a los
profesionales de la salud. El pago de esta bonificación se realizará de acuerdo una
escala establecida por el MINSA.
A continuación, se muestran las bonificaciones, en nuevos soles, que recibirán los
médicos en dos hospitales de Lima:

6
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
Hospital A
Número de
Bonificaciones
médicos
[250; 300[ 13
[300; 350[ 29
[350; 400[ 19
[400; 450[ 14
[450; 500] 5
Total 80

De acuerdo la información presentada en la tabla y el gráfico:


a) ¿Es posible calcular la mediana y la moda de las bonificaciones que recibirán
los médicos del hospital A? Si es posible, calcule dichos valores. En caso
contrario justifique su respuesta.
b) Estime la media y la desviación estándar muestral para las bonificaciones que
recibirán los médicos en cada uno de hospitales.
c) A partir la información obtenida en la parte b), determine en cuál de los dos
hospitales las bonificaciones que recibirán los médicos son más homogéneas.
Justifique su respuesta.

5. Durante el mes Marzo de este año, el promedio de ventas mensuales de las


vendedoras Olenka, Milagros y Estefanía fueron iguales; es decir
̅ 456789 ̅ : 59;<=> ̅ ?>@6A97í9 .

Si la relación de las varianzas de las ventas de las tres vendedoras es como sigue

456789 C : 59;<=> C ?>@6A97í9 ,

¿De qué vendedora sus ventas fueron más dispersas? Justifique su respuesta.

Respuestas para Practica 3.4b

1. a)F b) F c) F
2. a. Tabla de frecuencias
Frecuencia Frecuencia
Marca Cantidad de Frecuencia Frecuencia
absoluta relativa
Edades de clase hombres relativa porcentual
fi acumulada acumulada
X’i hi pi
Fi Hi
[12; 21[ 16,5 80 0,30 80 0,30 30 %

7
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
[21; 30[ 25,5 57 0,21 137 0,51 21 %
[30; 39[ 34,5 51 0,19 188 0,70 19 %
[39; 48[ 43,5 41 0,15 229 0,85 15 %
[48; 57[ 52,5 30 0,11 259 0,96 11 %
[57; 66] 61,5 11 0,04 270 1 4%
270 1 100 %
b) Edad promedio aproximada= 31,73 años.
c) No se puede calcular la moda, ni la mediana a partir de la tabla, pues se necesita
las edades de los 270 hombres.
d) Desviación estándar muestral = 13,57 años.
e) Para las mujeres: x m  31,53 y s m  2 , 55
Para los Hombres: x h  31,73 y s h  13 , 57
2,55 13,57
CV m   0,0808 CV h   0,4276
31,53 31,73

El conjunto de las mujeres tiene los datos menos dispersos.


3. a) Para el criadero Artemisa: D 703,33 - y 99,66 -

b) Sabemos que para el criadero Brígida: x b  710 , 41 g. y s b  102 , 58 g.

01 0,1417 CV b  102 ,58  0 ,1443


EE,FF
GHI,II 710 , 41

En el criadero Artemisa se tiene los pesos más homogéneos con respecto al


criadero Brígida.
4. a) No es posible calcular la moda, ni la mediana en el hospital A, pues es necesario
conocer las bonificaciones de cada uno de los médicos.
b) Para el hospital A: ̅ 355,63 JK nuevos soles y 57,09 JK
Para el hospital B: ̅ 361,47 JK y 65,19 JK .

c) Comparamos con el coeficiente de variación:


01 0,161 01 0,180
LG,HE FL,ME
ILL,FI IFM,NG

En el hospital A tienen las bonificaciones más homogéneas con respecto al


hospital B.
5. Al ser las varianzas y las desviaciones muestrales valores positivos, se cumple
también que:

4 C : C ?

Si dividimos esa desigualdad entre el promedio de ventas mensuales de las


vendedoras:

8
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.
ESTUDIOS
GENERALES
LETRAS
C C
4 : ?
̅ ̅ ̅

C C
4 : ?
̅4 ̅: ̅?

Se determina que:

014 C 01: C 01?

Por lo tanto, la vendedora que tiene ventas más dispersas es Estefanía, ya que sus
ventas tienen un coeficiente de varianza mayor que las otras vendedoras.

9
Este material corresponde al Capítulo 3: Análisis de datos del curso de Matemática Básica MAT155 de
EEEGGLL de la Pontificia Universidad Católica del Perú, 2020-1.

También podría gustarte