Estadistica JORGE
Estadistica JORGE
Estadistica JORGE
Objetivos :
Calcular e interpretar medidas de tendencia central para un conjunto de datos estadísticos.
Andrés quiere saber la edad promedio de un grupo de sus amigos. Para ello ordena los datos en una tabla:
Edades de los amigos
Edad Nombre Para calcular el promedio debes sumar todas las edades
13 Camila y dividirlas por el número de datos:
16 Andrea
¿Cuántos años suman en total? 160
14 Matías
19 Felipe Divide el total por el número de datos:
18 María
17 Joaquín
15 Nicolás
La media es: 16
16 Paula
16 Paz
16 Tomás
2. La siguiente tabla de distribución muestra el sueldo de 40 empleados de una empresa. Encuentra el promedio
de los sueldos mensuales
Sueldo ($) Frecuencia
250.000 3 𝑥̅ =3 + 4 + 15 + 6 + 5 + 4 + 3
190.000 4 7
150.000 15 𝑥̅ = 40
7
195.000 6
170.000 5
𝑥̅ = 5,7
180.000 4
175.000 3
3. Observa los datos obtenidos sobre el color del pelo de un grupo de un colegio y responde.
82 78 49 45 42 21 12 9 4
2) Vuelve a ordenar la tabla de edades de los familiares de Andrés, pero esta vez incluye al tío Pedro que tiene 35
años de edad:
4 9 12 21 35 42 45 49 78 82
a) ¿Podemos decir que en este caso existe un dato central? ¿Por qué?
Si existe un dato central porque se suman los dos datos centrales y luego se divide en dos.
Mediana (Me): es el valor que ocupa la posición central de los datos de la muestra, ordenados de manera
creciente o decreciente.
- La mediana deja la misma cantidad de datos a la izquierda y a la derecha.
- Cuando existen dos valores centrales, la mediana se determina calculando el promedio entre éstos.
3) Identifica, para cada grupo de datos, aquel que corresponde a la mediana. Recuerda ordenar los datos.
2 3 5 3 6 7 5 3 1 2 4
1 2 2 3 3 3 4 5 5 6 7
2,1 3,8 3,9 4,0 4,6 4,5 4,6 5,3 5,4 5,4 5,4 4,9 5,5
5,6 5,7 5,8 5,8 6,0 6,1 6,2 6,2 6,5 6,5 6,8 7,0 7,0
𝑥̅ = 5,55
c) El número de televisores que tienen en sus casas los alumnos de un curso son las siguientes:
1 4 2 5 2 3 2 3 2 1 1 1 2 4 4 5 1 2 4 3 2 1 2 3 2
1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 4 4 4 4 5 5
En este caso, la muestra fue de 109 alumnos y la actividad solidaria que más se repite es
1) La familia de Ignacia tiene 2 televisores. Entre todos deciden comprar uno más. Para esto, investigan en todas
las tiendas de la ciudad el precio de un modelo específico,
Precio($) N° de tiendas que tienen obteniendo los siguientes resultados:
es precio
120.000 1
135.000 3 ¿Cuántas tiendas consultaron en total?
152.000 2 9 tiendas
170.000 2
199.000 1 ¿Cuál es la moda?
Bimodal Mo = 1,2
2) Para cada conjunto de datos, construye la tabla de frecuencias correspondiente y, luego, identifica el dato
donde se encuentra la moda.
16 17 15 18 14 14 13 16 13 14 16 13 14 14 13 16
18 17 13 14 14 17 14 16 14 15 16 14 15 13 17 14
b) Los siguientes datos representan el número de calzado de un grupo de niños de un jardín infantil
27 26 28 27 27 28 27 26 29 27 28 26 29 27 29
26 26 26 27 27 27 27 27 27 27 28 28 29 29 29
Mo = 27
c) Las temperaturas máximas, medidas en °C, en Temuco durante el mes de Junio, fueron
12 11 10 11 9 12 11 10 7 7 9 10 11 12 11
11 7 9 9 11 12 10 11 10 10 9 11 11 12 12
Mo= 11
3) Del ejercicio 2 encuentra la mediana y el promedio.
MEDIDAS DE DISPERSION
RANGO O RECORRIDO
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
VARIANZA
( xi x )
2
s 2
n 1
Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza se denota por 2.
( xi ) 2
2
N
CUANDO LOS DATOS SON AGRUPADOS
s 22
f (X
i x)2
i
n 1
Si el conjunto de DATOS ES UNA POBLACIÓN, la varianza es:
22
f (X
i ii ) 22
N
DESVIACION ESTANDAR
s s 22
Si el conjunto de DATOS ES UNA POBLACIÓN, la desviación estándar se denota por (sigma).
22
COEFICIENTE DE VARIACION
El coeficiente de variación indica que tan grande es la desviación estándar en relación al promedio.
Si un conjunto de datos es una muestra, el coeficiente de variación se calcula como sigue:
s
(100)
x
Si un conjunto de datos es una población, el coeficiente de variación se calcula como sigue:
(100)
Mide la variación relativa de la variable con respecto a su promedio.
Cuando deseamos comparar la dispersión de dos distribuciones, necesitamos medir la magnitud de la desviación
estándar en relación con la magnitud de la media
Expresa a la variación de los datos como porcentaje de su promedio.
1) La siguiente tabla presenta el tiempo (en minutos) que se demora un fiscalizador del S.I.I en resolver
inconsistencias en los formularios de la declaración de la Renta.
Intervalo Fi
40 - 45 7
45 – 50 10
50 - 55 15
55 - 60 13
60 - 65 18
65 - 70 21
70 - 75 16
75 - 80 10
3) Los ingresos mensuales en miles de pesos de un grupo de personas son los siguientes:
Ingresos fi Xi fi.xi
200-250 2 225 450
250-300 8 275 2200
300-350 12 325 3900
350-400 7 375 2625
400-450 5 425 2125
450-500 4 700 2800
500-550 2 775 1550
40 15,650
1) La siguiente tabla presenta las notas obtenidas en una prueba por un curso de 20 personas
Moda:
3,6+3,6
= 3,6
2
1,82 + 2,87 + 3,03 + 3,5 + 3,74 + 4.1 + 4.1 + 4,22 + 4,58 + 4,82 + 5 + 5,3 + 5,54 + 5,66 + 5,66 + 5,9 + 5,9 + 5,9 + 6,26
10
92,03
= 9,2
10
Promedio = 9,2
SALARIO fi
100 – 110 8
110 – 120 2
120 – 130 2
130 – 140 4
140 - 150 0
150 – 160 18
160 - 170 12
Desviación
� = √540,75 = 23,25
Varianza Mujeres
(3 − 29,5)² + (60 − 29,5)² + (37 − 29,5)² + (17 − 29,5)²
�2 =
4
4) En una clase hay 35 estudiantes varones con una edad media de 17. 5 años y 15 estudiantes
mujeres las que en promedio son 12% más Jóvenes. ¿Cuál es la edad media de la clase?
�̅ = 16,97
5) Sumando 5 a cada número del conjunto 3, 6, 2, 1, 7, 5, obtenemos 8, 11, 7, 6, 12, 10. Probar
que ambos conjuntos de números tienen la misma desviación típica pero diferentes medias
¿Cómo están relacionadas las medias?
Comprobación de diferentes medias
3 + 6 + 2 + 1 + 7 + 5 = 24
24
=4
6
8 + 11 + 7 + 6 + 12 + 10 = 54
54
=9
6
Varianza
(1 + 4 + 4 + 9 + 9 + 1 28
= = 4,66
6 6
Desviación
� = √4,66 = 2,16
Media
8 + 11 + 7 + 6 + 12 + 10 54
�̅ = = =9
6 6
6) El retraso en la entrega de los últimos 100 pedidos de material informático en una empresa
se ha agrupado en 4 intervalos, recordándose solo los siguientes datos de la distribución:
● El primer intervalo tiene 6 días como extremo superior, una frecuencia relativa de 0,2 y
una amplitud de 4 días.
● En el segundo intervalo se acumulan 60 entregas retrasadas.
● Las marcas de clases del segundo y cuarto intervalo son 8 y 50 días, respectivamente.
● El tercer intervalo presenta una frecuencia de 30 entregas retrasadas y una amplitud de
30 días.
8 + 25 33
= = 16,5
2 2
c) Calcular la mediana, moda, varianza, desviación estándar, el coeficiente de variación
Mediana
�̅ = 4+8+25+50
4
=
4
87
= 21,75
50
Varianza
d) ¿Entre qué valores se encuentra el 50% central del tiempo de retraso en las entregas?
40-60
Desviación estándar
� = √6 = 2,449
Coeficiente de variación
8) Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número
de cigarros que son consumidos en promedio al día por un conjunto de 20 encuestados.
2 4 10 6 0 4 1 0 3 6
10 2 4 2 3 2 5 5 8 0
2 + 4 + 10 + 6 + 0 + 4 + 1 + 0 + 4 + 6 + 10 + 2 + 4 + 2 + 3 + 2 + 5 + 5 + 8 + 0 77
= = 3,85 ≈ 4
20 10
Varianza
4 + 0 + 36 + 16 + 0 + 4 + 9 + 16 + 1 + 16 + 36 + 4 + 0 + 4 + 1 + 4 + 1 + 1 + 16 + 16 185= 9
�2 = =
20 20
Desviación estándar
� = √9 = 3
9) La siguiente tabla muestra los coeficientes de inteligencia de 480 niños de una escuela
elemental.
Calcula:
a) El C.I. medio de los niños estudiados
�� = 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126
�� = 4 + 9 + 16 + 28 + 45 + 66 + 85 + 72 + 54 + 38 + 27 + 18 + 11 + 5 + 2 = 480
�̅
280 + 666 + 1248 + 2296 + 3870 + 5940 + 7990 + 7056 + 5508 + 4028 + 2970 + 2052 + 1298 + 610 + 2
=
480
46064
= = 95.96
480
b) Su desviación típica.
ARIANZA
�2
(70 − 95,96)2 ∗ 4 + (74 − 95,96)2 ∗ 9+(78 − 95,96)2 ∗ 16+(82 − 95,96)2 ∗ 28+(86 − 95,96)2 ∗ 45+(90 − 9
=
20
+(94 − 95,96)2 ∗ 85+(98 − 95,96)272+(102 − 95,96)2 ∗ 54+(106 − 95,96)2
∗ 38+(110 − 95,96)2 ∗ 27+(114 − 95,96)2 ∗ 18+(118 − 95,96)2 ∗ 11
+ (122 − 95,96)2 ∗ 5 + (126 − 95,96)2 ∗ 2
47957,41
�2 = = 99,91
480
Desviación típica
� = √99,91 = 9,98
c) Si una madre afirma que exactamente la mitad de los niños del colegio tienen un C.I.
superior al de su hijo, ¿qué C.I. tiene el niño?
xi ni Fi Ni Fi
70 4 0,0083 4 0,0083
74 9 0,019 13 0,027
78 16 0,03 29 0,06
82 28 0,058 57 0,119
86 45 0,09 102 0,21
90 66 0,138 168 0,35
94 85 0,177 253 0,527
98 72 0,15 325 0,677
102 54 0,11 379 0,7896
106 38 0,079 417 0869
110 27 0056 444 0,925
114 18 0,038 462 0,96
118 11 0,02 473 0,985
122 5 0,01 478 0,996
126 2 0,004 480 1
total 480
(��)��−1
�� = �� + [2 ]0
(��)��
480 (168)
�� = 94 + [ 2 ]0
(85)
�� = 94
d) Supongamos que se quieren hacer estudios sobre el proceso de aprendizaje de los niños
con mayor C.I., pero que el psicólogo solo puede atender al 15% de los niños del centro.
¿Qué C.I. deberá tener un niño como mínimo para ser considerado dentro de ese grupo
de elegidos?
480∗ 19%
= 72
100%
72 ����
e) Se van a preparar unas clases de apoyo, para un 25% de los niños del centro,
precisamente para aquellos que tengan menor C.I. ¿Hasta que niños de qué C.I.
deberemos considerar en estas clases?
480∗ 25%
= 120
100%
Xi 5 10 15 20 25
n 3 7 5 3 2 i
Media
�� = 5 + 10 + 15 + 20 + 25
� = 3 + 7 + 5 + 3 + 2 = 20
15 + 70 + 75 + 60 + 50
�̅ = = 13,5
20
Deviación media
−8,5−3,5+1,5+6,5+11,5 7,5
�� = |5−13,5|+|10−13,5|+|15−13,5|+|20−13,5|+|25−13,5|
20
= 20 20
= = 0,375
�� = 0,375
Varianza
(5 − 13,5)2 = (−8,5)2 = 72,25 (10 − 13,5)2 = (−3,5)2 =12,25 (15 − 13,5)2 =(1,3)2 = 1,69
(20 − 13,5)2 = (6,5)2 = 42,25 (25 − 13,5)2 = (11,5)2 = 132,25
Desviación estándar
� = √13,03 = 3.60
11) Calcular todas las medidas de dispersión para los datos de la siguiente distribución
x 0–100 100–200 200–300 300-800
n 90 140 150 120
12) Una empresa de fabricación de productos cerámicos dispone de tres centros de producción.
En el centro A, el más grande y moderno, se hace un estudio de los m² de azulejo producidos
al mes
durante el año pasado, obteniéndose2. Se sabe una que media el centro de producción B,
por tener mensual maquinaria más anticuada m2, con que una desviación típica SA =
15.000 m
A, produce cada mes un tercio de la producción de A, y que el centro C, por tener un horno
menos que B, produce cada mes 25.000 m² menos que B ¿Cual es la media y la varianza de
la producción mensual de C?
Centro A:
μ = 250.000m²
σ = 15.000 m²
Centro B
1
Produce menos de la producción de A
3
Centro C
Como el promedio de
A = 250.000
1 250000
�= �=
3 3
C = B - 25.000 = 250000
− 25000
3
250000 − 75000 175000
C= =
3 3
Entonces el promedio de C
C = 58.333,33 m²