Tema 6.4 - Practica Prueba Chi-Cuadrado
Tema 6.4 - Practica Prueba Chi-Cuadrado
Tema 6.4 - Practica Prueba Chi-Cuadrado
Semana 09
Practica Prueba Chi-cuadrado
SEMESTRE 2020 - II
1 Hipótesis Estadística
2 Formulación de Hipótesis
Temas a
Desarrollar 3 Contraste de Hipótesis
En la modalidad virtual participamos a través del chat, para ello usamos la opción “Levantar la mano”.
Valor critico del Chi-cuadrado (de tabla)
α = nivel de significancia
1- α = nivel de confianza
α -v α -v
X2f (de formula) < X2t (de tabla) X2t (de tabla) < X2f (de formula)
X2
𝟐 𝟐
+ 𝟑 𝟑
+ 𝟒 𝟒
2 22 17.5 𝒇 𝒆𝟏 𝒇 𝒆𝟐 𝒇 𝒆𝟑 𝒇 𝒆𝟒
X2 𝟏𝟕 . 𝟓 𝟏𝟕 .𝟓 𝟏𝟕 .𝟓 𝟏𝟕 . 𝟓
4 17 17.5
X2
Regla de decisión
X 2
< X
2
0,05 - 3
Cara 1 2 3 4 5 6
Frecuencia Observada 38 31 28 36 37 30
Regla de decisión
Aplicación: X2 Obtenido de formula= 2.62 •
X2 Crítico o de tabla = 11,0705 X2 = 2.62 X20,05 - 5 = 11.0705
X 2
< X 2
0,05 - 5
Se acepta H0
𝟐 .𝟔𝟐<𝟏𝟏.𝟎𝟕𝟎𝟓 Como el 2.62 es menor a 11.07 se acepta H 0 y se concluye con un = 0,05 que el dado
esta bien hecho, significativamente las frecuencias son iguales.
PRUEBA DE BONDAD DE AJUSTE
DISTRIBUCION DE PATRON ESPECIFICO
Una empresa embotelladora de gaseosas ha instalado una máquina mezcla
saborizantes, agua gasificada, colorantes y edulcorantes a razón de 4:9:1:2. Se
encuentra que una botella que contiene 510 mililitros de gaseosa esta compuesta
por 130 ml., de saborizante, 340 de agua gasificada, 15 ml., de colorantes y 25 ml.,
de edulcorante. A un nivel de significancia de 0.05 pruebe la hipótesis de que la
máquina mezcla los componentes de acuerdo a la especificación técnica.
X2
X
2 X 2 =
X2
Regla de decisión
Aplicación: X2 Obtenido de formula= 44,09
X2 Crítico o de tabla = 7,8147
0,05 del área
X 2
> X 2
0,05 - 3
𝟒𝟒
.𝟎𝟗>𝟕 .𝟖𝟏𝟒𝟕
Se rechaza H0
X20,05 - 3 = 7,8147
X2 = 44.09
Como el 44.09 es mayor a 7.814 se rechaza H 0 y se concluye con un = 0,05 que ña maquina no mezcla
los componentes a razón de 4; 9; 1; 2.
Una conocida entidad financiera trata de seguir una política de extender un 60% de
sus créditos a empresas comerciales; un 10% a personas naturales y un 30% a
prestatarios extranjeros. Con la finalidad de determinar si la política se estaba
siguiendo, el gerente de mercado selecciona aleatoriamente 85 créditos que se
aprobaron recientemente. Encuentra que 62 de tales créditos se otorgaron a
negocios, 10 a personas naturales y 13 a prestatarios extranjeros. Al nivel del 10%.
¿parece que el patrón de cartera deseado se preserva?.
Planteamiento de la Hipótesis:
H0: Se mantuvo el patrón deseado de: 60% de créditos comerciales, 10% de prestamos personales
y 30% de créditos extranjeros..
H1: No se mantuvo el patrón deseado de los créditos.
Valor estadistico Chi-cuadrado de prueba (formula)
X 2 = X2
X2 X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de = 0,1
Siendo: Nº de filas = 3 Entonces el Nivel de confianza de: 1- = 0,9
Entonces G.L. = 3 - 1 = 2
El chi-cuadrado de tabla es:
X20.1 - 2 = 4.6052
Regla de decisión
Aplicación: X2 Obtenido de formula= 8.76 0,1 del área
X2 Crítico o de tabla = 4.6052
X 2
> X 2
0,01 - 3
n = es el número de experimentos. n =5
x = es el número de aciertos. x = 0; 1; 2; 3; 4; 5.
Para calcular el valor de p, se sabe que 𝜇=𝑛∗ 𝑝 en una distribución binomial.
(1) = 5! 1 ( 5− 1)
1 cara y 4 sellos x=1 𝑃 ∗0.494 ∗ 0.506 = 0.16191945 0.1619
1 ! ( 5 −1 ) !
(2) = 5!
2 caras y 3 sellos x=2 𝑃 ∗ 0.4942 ∗ 0.506 (5 −2 )=0.31615893 0.3162
2 ! (5 − 2)!
(3) = 5!
3 caras y 2 sellos x=3 𝑃 ∗ 0.4943 ∗ 0.506( 5 − 3) = 0.3086611 0.3087
3 ! ( 5− 3 ) !
(4 )= 5!
4 caras y 1 sello x=4 𝑃 ∗ 0.494 4 ∗ 0.506 (5 −4 )=0.1506705 0.1507
4 ! ( 5 −4 ) !
(5) = 5! 5 ( 5 − 5)
5 caras y 0 sellos x=5 𝑃 ∗ 0.494 ∗ 0.506 =0.0294195 0.0294
5 ! ( 5− 5 ) !
Valor estadistico Chi-cuadrado de prueba (formula)
Numero de Serie Observada Serie Esperada
fo P(x) fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Caras
0 38 0.0332 33.2 4.8 23.4 0.693976
1 144 0.1619 161.9 -17.9 320.41 1.979061
2 342 0.3162 316.2 25.8 665.64 2.105123
3 287 0.3087 1.525397
308.7 -21.7 470.89
4 164 0.1507
150.7 13.3 176.89 1.173789
5 25 0.0294
29.4 -4.4 19.36 0.658503
1000 1.00
1000 0.0 X2 = 8.135849
X 2 = X2
X2
X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de = 0,05
Siendo: Nº de filas = 6 Entonces el Nivel de confianza de: 1- = 0,95
Entonces G.L. = 6 - 1 = 5
El chi-cuadrado de tabla es:
𝟖 .𝟏𝟒 <𝟏𝟏. 𝟎𝟕𝟎𝟓 Como el 8.14 es menor a 11.07 se acepta H 0 y se concluye con un = 0,05 que al
lanzar la moneda salga cara o sello se ajusta a una distribución binomial, es igualmente
Se acepta H0 probable.
5.- Una encuesta sobre 320 familias con 5 niños dio la
distribución que aparece en la siguiente tabla. ¿Es el resultado
consistente con la hipótesis de que el nacimiento de varón o
mujer son igualmente posibles? Use α = 0.05.
Número de niños 5 4 3 2 1 0
Número de niñas 0 1 2 3 4 5
Número de familias 18 56 110 88 40 8
Para obtener los valores esperados se tiene que utilizar la formula de la distribución binomial:
𝑃( 𝑥 )=𝐶 𝑛 𝑥 (𝑛 − 𝑥) 𝑛 𝑛!
𝑥 ∗ 𝑝 ∗ 𝑞 𝐶 𝑥 =
𝑥 ! ( 𝑛− 𝑥 ) !
𝑛!
𝑃(𝑥)= ∗ 𝑝 𝑥 ∗ 𝑞(𝑛 − 𝑥) probabilidad de ocurrencia
𝑥 !(𝑛 − 𝑥 ) !
n = es el número de experimentos. n =5
x = es el número de aciertos. x = 0; 1; 2; 3; 4; 5.
Probabilidad de:
(0 )= 5! 0 ( 5 − 0)
𝑃 ∗0.5 ∗ 0.5 =0.03125 0.0313
0 niños y 5 niñas x=0 0 ! ( 5 −0 ) !
(1) = 5! 1 ( 5 −1 )
1 niño y 4 niñas x=1 𝑃 ∗0.5 ∗0.5 =0.15625 0.1563
1 ! ( 5 −1 ) !
(2) = 5! 2 ( 5 − 2)
2 niños y 3 niñas x=2 𝑃 ∗ 0.5 ∗ 0.5 =0.3125 0.3125
2 ! (5 − 2)!
(3) = 5!
3 niños y 2 niñas x=3 𝑃 ∗ 0.53 ∗0.5 (5 −3 ) =0.3 125 0.3125
3 ! ( 5− 3 ) !
(4 )= 5! 4 (5 − 4 )
4 niños y 1 niña x=4 𝑃 ∗ 0.5 ∗ 0.5 =0.15625 0.1563
4 ! ( 5 −4 ) !
(5) = 5! 5 ( 5 −5 )
5 niños y 0 niñas x=5 𝑃 ∗ 0.5 ∗0.5 =0.03125 0.0313
5 ! ( 5− 5 ) !
Valor estadistico Chi-cuadrado de prueba (formula)
Numero de Serie Observada Serie Esperada
fo P(x) fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Niños-16
0 18 0.0313 10 8 64.0 6.4
1 56 0.1563 50 6 36.0 0.72
2 110 0.3125 100 10 100.0 1.0
3 88 0.3125 1.44
100 -12 144.0
4 40 0.1563
50 -10 100.0 2.0
5 8 0.0313
10 -2 4.0 0.4
320 1.00
320 0.0 X2 = 11.96
X 2 = X2
X2 X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de = 0,05
Siendo: Nº de filas = 6 Entonces el Nivel de confianza de: 1- = 0,95
Entonces G.L. = 6 - 1 = 5
El chi-cuadrado de tabla es:
Regla de decisión
Aplicación: X2 Obtenido de formula = 11.96 •
X2 Crítico o de tabla = 11,0705 X20,05 - 5 = 11.0705
X 2
> X20,05 - 5 X2 = 11.96
11.96 > 11.0705 Como el 11.96 es mayor a 11.07 se rechaza H 0 y se concluye con un = 0,05 que el
Se rechaza H0 nacimiento de hombres o mujeres no es igualmente probable.
PRUEBA DE BONDAD DE AJUSTE
DISTRIBUCION DE POISSON
Se propone que el número de defectos en las tarjetas de circuito impreso sigue
una distribución Poisson. Se reúne una muestra aleatoria de 60 tarjetas de
circuito impreso y se observa el número de defectos. Los resultados obtenidos
son los siguientes:
Número de Defectos 0 1 2 3 o más
Circuitos 32 15 9 4
¿Muestran estos datos suficiente evidencia para decir que provienen de una
distribución Poisson?. Haga la prueba de la bondad del ajuste con un α = 5%
Planteamiento de la Hipótesis:
H0 : La forma de la distribución de los defectos provienen de una distribución de Poisson.
H1 : La forma de la distribución de los defectos no provienen de una distribución de Poisson
donde λ : (lambda): = np
λ𝑥 𝑒− λ
𝑃(𝑥)= e : base de logaritmos naturales = 2.71828
𝑥! x!: factorial de x
La media de la DISTRIBUCIÓN POISSON propuesta en este ejemplo es desconocida y
debe estimarse a partir de los datos contenidos en la muestra.
x (defectos) 0 1 2 3 o más ( 32 ) ( 0 ) + ( 15 ) ( 1 ) + ( 9 ) ( 2 ) +( 4)(3)
Circuitos 32 15 9 4
𝜇= λ
¿
60
𝜇= λ=0.75
A partir de la distribución Poisson con parámetro 0.75 pueden calcularse las probabilidades
asociadas con el valor de x. Esto es la fórmula de la Poisson es:
0.75 𝑥 ( 2.71828)− 0.75
𝑃(𝑥)= probabilidad de ocurrencia
𝑥!
Con esta fórmula se calcula la probabilidad de ocurrencia, mismas que se multiplican por 60
para obtener los valores esperados.
Utilizando la fórmula de la distribución de Poisson:
x 0 1 2 3 Total
P(x) 0.4724 0.3543 0.1329 0.0404 1.0
Probabilidad de:
0 −0.75
2 − 0.75
X 2 = X2
X2 X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de = 0,05
Siendo: Nº de filas = 4 Entonces el Nivel de confianza de: 1- = 0,95
Entonces G.L. = 4 - 1 = 3
El chi-cuadrado de tabla es:
Como el 3.5425 es menor a 7.8147 se acepta H 0 y se concluye con un = 0,05 que la
Se acepta H0
forma de distribución de los defectos proviene de una distribución de Poisson.
PRUEBA DE BONDAD DE AJUSTE
PRUEBA DE NORMALIDAD O DISTRIBUCION NORMAL
Las especificaciones para la producción de tanques de aire para inmersión requieren que los
tanques se llenen a una presión promedio de 600 libras por pulgada cuadrada (psi). Se
permite una desviación estándar de 10 psi. Las especificaciones de seguridad permiten una
distribución normal en los niveles de llenado. Usted acaba de ser contratado por AQUA
LUNG, un importante fabricante de equipos de inmersión. Su primera tarea es determinar si
los niveles de llenado se ajustan a una distribución normal. La empresa esta segura que la
media de 600 psi., y la desviación estándar de 10 psi., prevalecen. Solo queda por probar la
naturaleza de la distribución. En este esfuerzo se mide n = 1000 tanques y se halla la
distribución presentada en la siguiente tabla, siendo el nivel de significancia de = 0,05:
PSI Frecuencia Real
0 y por debajo de 580 20
580 y por debajo de 590 142
590 y por debajo de 600 310
600 y por debajo de 610 370
610 y por debajo de 620 128
620 y por encima 30
1 000
Planteamiento de la Hipótesis:
H0 : Los niveles de llenado están distribuidos normalmente.
H1 : Los niveles de llenado no están distribuidos normalmente.
𝑷 ( 𝒛> 𝟐 ) =𝟎 . 𝟓
𝑃 ( 600< 𝑋 < 610 )= 0.5− 0.4772= 0.0228
Valor estadistico Chi-cuadrado de prueba (formula)
Libras por pulgada
Serie Observada Serie Esperada
cuadrada P(x) fo-fe (fo-fe)2 (fo-fe)2 /fe
PSI fo fe
0 < X < 580 20 0.0228 22.80 -2.8 7.84 0.3438596
580 < X < 590 142 0.1359 135.90 6.1 37.21 0.2738042
590 < X < 600 310 0.3413 341.30 -31.3 979.69 2.8704658
600 < X < 610 370 0.3413 341.30 28.7 823.69 2.4133899
610 < X < 620 128 0.1359
135.90 -7.9 62.41 0.4592347
620 < X 30 0.0228
22.80 7.2 51.84 2.2736842
1 000 1.00
1000 0.0 X2 = 8.6344384
X 2 = X2
X2 X2
Grados de Libertad
G.L. = Nº de filas - 1 Nivel de significancia de = 0,05
Siendo: Nº de filas = 6 Entonces el Nivel de confianza de: 1- = 0,95
Entonces G.L. = 6 - 1 = 5
El chi-cuadrado de tabla es:
Número de hijos
Educación 0-1 2-3 Mas de 3 Valor Mg. Filas
Elemental 14 37 32 83
Secundaria 19 42 17 78
Universidad 12 17 10 39
Valor Mg. Columnas 45 96 59 200
𝒇 = 𝑪 𝒕 ∗ 𝑹𝒕
𝒆
𝒏
= Total por fila
𝑒 = 𝑛● 𝑗 ∗ 𝑛𝑖 ● = Total por columna
𝑖𝑗
𝑛 = Total por fila
= Frecuencia esperada en una celda
Numero de hijos
Educación Valor Mg. Filas
0-1 2-3 Mas de 3
Elemental 14 37 32 83
Secundaria 19 42 17 78
Universidad 12 17 10 39
Valor Mg. Columnas 45 96 59 200
Frecuencias esperadas: fe Numero de hijos
Educación
0-1 2-3 Mas de 3
𝑪𝒕∗ 𝑹𝒕
𝒇 𝒆 = Elemental (45*83)/200 (96*83)/200 (59*83)/200
𝒏
Secundaria (45*78)/200 (96*78)/200 (59*78)/200
𝑛● 𝑗 ∗ 𝑛𝑖 ● Universidad (45*39)/200 (96*39)/200 (59*39)/200
𝑒 𝑖 𝑗 =
𝑛 Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental 18.675 39.84 24.485 83
Secundaria 17.55 37.44 23.01 78
Universidad 8.775 18.72 11.505 39
45 96 59 200
Frecuencias observadas: fo Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental 14 37 32
Secundaria 19 42 17
Universidad 12 17 10
Frecuencias esperadas: fe Numero de hijos
Educación
0-1 2-3 Mas de 3
Elemental 18.675 39.84 24.485
Secundaria 17.55 37.44 23.01
Universidad 8.775 18.72 11.505
X2
X 2
= 7.464393
Grados de Libertad G.L. = (Nº de Columnas – 1)*(Nº de filas – 1)
Gl = (r-1)*(k-1) r =3 k =3
Gl = (3-1)*(3-1) = 4
Nivel de significancia de = 0,05 Entonces el Nivel de confianza de: 1- = 0,95
El chi-cuadrado de tabla es:
Nivel de significación
α =0.05
Grados de libertad
r =3 k =3
r-1 k-1 =2
=2
Gl = (r-1)*(k-1) = 4
Regla de decisión
0,05 del área
X 2
= 7.464393
X 2
= 9.4877
•
0,05 - 4 X20,05 -4 = 9.4877
X2 = 7.46
X 2
< X 2
0,05 - 4
Como el 7.46 es menor a 9.48 se acepta H 0 y se concluye con
un = 0,05 que el tamaño de la familia es independiente del
Se acepta la hipótesis nula nivel de instrucción del padre
PRUEBA DE INDEPENDENCIA
La directora de investigación de productos de una fábrica. En su proyecto actual, debe
determinar si existe alguna relación entre la clasificación de efectividad que los
consumidores asignan a un nuevo producto y el sitio (urbano o rural) en el cual se utiliza.
De los 100 consumidores a quienes se les practico la encuesta, 75 vivían en zonas
urbanas y 25 en zonas rurales, en la tabla de contingencia se resumen las clasificaciones
realizadas. Pruebe la hipótesis, con un nivel de significancia de 10%.
Atributo B: Ubicación
Atributo A Clasificación Urbano Rural Total
Encima del promedio 20 11 31
Promedio 40 8 48
Debajo del promedio 15 6 21
Atributo B: Ubicacion
Atributo A: Clasificación Urbano Rural Valor Mg. Filas
𝒇 = 𝑲 𝒕 ∗ 𝑹𝒕
𝒆
𝒏
= Total por fila
= Total por columna
= Total por fila
= Frecuencia esperada en una celda
Atributo B: Ubicacion
Atributo A: Clasificación Urbano Rural Valor Mg. Filas
23.3 7.7 31
36.0 12.0 48
15.7 5.3 21
75 25 100
Frecuencias observadas: fo Frecuencias esperadas: fe
Atributo B: Ubicacion Atributo B: Ubicacion
Atributo A: Clasificación Urbano Rural Atributo A: Clasificación Urbano Rural
Encima del promedio 20 11 Encima del promedio 23.3 7.7
Promedio 40 8 Promedio 36.0 12.0
Debajo del promedio 15 6 Debajo del promedio 15.7 5.3
X 2
= Frecuencia observada en una celda
= Frecuencia esperada en una celda
X2
X2
X2
Grados de Libertad G.L. = (Nº de Columnas – 1)*(Nº de filas – 1)
Gl = (r-1)*(k-1) r =3 k =2
Gl = (3-1)*(2-1) = 2
Nivel de significancia de = 0,05 Entonces el Nivel de confianza de: 1- = 0,95
El chi-cuadrado de tabla es:
Regla de decisión
0,1 del área
X 2
= 3.76
•
X 2
0,1 - 2 = 4.6052
X2 = 3.76 X20,1 - 2 = 4.61
X 2
< X 2
0,1 - 2
Como el 3.76 es menor a 4.61 se acepta H 0 y se concluye con
un = 0,1 que el tamaño de la clasificación y la ubicación son
Se acepta la hipótesis nula independientes.
Ejercicios a Desarrollar
1. Una agencia de publicidad intenta determinar la composición demográfica del mercado para
un nuevo producto. Seleccionaron al azar 75 personas de cada uno de 5 grupos de edad y les
presentaron el producto. Los resultados de la encuesta son los siguientes:
Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente 40 183 12 5 7
Compra alguna vez 24 26 2 2 0
Nunca compra 48 70 2 0 1
Frecuencias esperadas: fe
Grupo de Edad
Actividad Futura
𝑪𝒕∗ 𝑹𝒕 18-29 30-39 40-49 50-59 60-69
𝒇 𝒆 =
𝒏 Compra Frecuente (112*247)/422 (279*247)/422 (16*247)/422 (7*247)/422 (8*247)/422
Compra alguna vez (112*54)/422 (279*54)/422 (16*54)/422 (7*54)/422 (8*54)/422
𝑒 = 𝑛● 𝑗 ∗ 𝑛𝑖 ●
𝑖𝑗
𝑛
Nunca compra (112*121)/422 (279*121)/422 (16*121)/422 (7*121)/422 (8*121)/422
65.5545 163.3009 9.3649 4.0972 4.6825 247
14.3318 35.7014 2.0474 0.8957 1.0237 54
32.1137 79.9976 4.5877 2.0071 2.2938 121
112 279 16 7 8 422
Frecuencias observadas: fo
Grupo de Edad
Actividad Futura
18-29 30-39 40-49 50-59 60-69
Compra Frecuente 40 183 12 5 7
Compra alguna vez 24 26 2 2 0
Nunca compra 48 70 2 0 1
X
2 = Frecuencia observada en una celda
= Frecuencia esperada en una celda
X2
X2 = 39.2747
b) Establezca las hipótesis nula y alternativa.
Hipótesis Nula: H0: Existe relación entre los grupo de edad y el nuevo producto.
Hipótesis Alternativa: Ha: No existe relación entre los grupo de edad y el nuevo producto.
α =0.01
r =3 k =5
r-1 =2 k-1 =4
Gl = (r-1)*(k-1) = 8
X 2
0,01 - 8 = 20,090
X 2
> X 2
0,01 - 8
Primaria Secundaria
Variables:
APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal.
NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.
Tabla de frecuencias observadas (fo):
NIVEL DE EDUCACIÓN
TOTAL
Primaria Secundaria
Conceptual 180 100 280
NIVEL DE EDUCACIÓN
Valor Marginal
Primaria Secundaria de filas
(𝒇 ¿ ¿𝒐 − 𝒇 𝒆 )𝟐 Donde:
¿ fo: frecuencia observada en cada celda
𝒇𝒆
fe: frecuencia esperada en cada celda
Celda fo fe fo-fe (fo-fe)2 (fo-fe)2 /fe
Primaria Conceptual 180 145,4 34,6 1197,16 8,23
Procedimental 190 244,4 -54,4 2959,36 12,11
Actitudinal 170 150,6 19,4 376,36 2,50
Secundaria Conceptual 100 134,6 -34,6 1197,16 8,69
Procedimental 280 226,0 54,0 2916,00 12,80
Actitudinal 120 139,4 -19,4 376,36 2,70
47,33
X2
X 2 X2
Aplicación:
X2 Obtenido de formula = 47,33 X 2
> X
2
0,05 - 2
Deportista 38 9
No Deportista 31 22
3. Estamos interesados en estudiar la fiabilidad de cierto componente informático
con relación al distribuidor que nos lo suministra. Para realizar esto, tomamos una
muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el
producto comprobando el número de defectuosos en cada lote. La siguiente tabla
muestra el número de defectuosos en para cada uno de los distribuidores.
Componentes Componentes
Defectuosos Correctos
Distribuidor 1 16 94 100
Distribuidor 2 24 76 100
Distribuidor 3 9 81 100
49 251 300
4. Un estudio que se realizó con 81 personas referente a la relación entre la cantidad
de violencia vista en la televisión y la edad del televidente produjo los siguientes
resultados.
¿Indican los datos que ver violencia en la televisión depende de la edad del
televidente, a un nivel de significación del 5%?
16 - 34 34 - 55 55 o mas
Poca Violencia 8 12 21
Mucha Violencia 18 15 7
5. Estamos interesados en estudiar la relación entre cierta enfermedad y la
adicción al tabaco. Para realizar esto seleccionamos una muestra de 150
individuos, 100 individuos no fumadores y 50 fumadores. La siguiente tabla
muestra las frecuencias de enfermedad en cada grupo (Completar la tabla).
Realizar un contraste de homogeneidad y obtener las conclusiones sobre la
relación entre las variables.
Padecen la No Padecen la
Enfermedad Enfermedad
Fumadores 12 88 100
No Fumadores 25 25 50
37 113 150
6. Estamos interesados en estudiar la fiabilidad de cierto componente
informático con relación al distribuidor que nos lo suministra. Para realizar
esto, tomamos una muestra de 100 componentes de cada uno de los 3
distribuidores que nos sirven el producto comprobando el número de
defectuosos en cada lote. La siguiente tabla muestra el número de
defectuosos en para cada uno de los distribuidores. El nivel de significación
del 5%,.
Componentes Componentes
Distribuidor
Defectuosos Correctos
1 16 94
2 24 76
3 9 81
Un investigador quiere estudiar si hay asociación entre la práctica deportiva y la sensación
de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a
continuación.
Sí 20 25 45
No 10 45 55
Total 30 70 100
Contraste la hipótesis de independencia entre bienestar y práctica de deporte (alfa = 0,01).
Se desea estudiar hasta qué punto existe relación entre el tiempo de residencia de
inmigrantes en nuestro país y su percepción de integración. Se dispone de una muestra
pequeña de 230 inmigrantes a los que se les evaluó en ambas variables obteniéndose la
siguiente tabla de frecuencias observadas. ¿Confirman estos datos la hipótesis
planteada con un nivel de confianza del 95%?
Sistema de Calificación
Aprobado-Reprobado 4,0 4,0 y Aprobado-reprobado
Bellas Artes 26 55 19
Ciencias 24 118 58
Ingeniería 20 112 68
El número de alumnos por semana que sufren algún tipo de accidente en un colegio durante 36
semanas del periodo escolar es la siguiente:
Probar si la muestra de datos se ajusta a una distribución de Poisson con intensidad λ, con un
nivel de significación de 5%
1. (Aplicación en Ciencias de la Salud) En una ciudad la distribución habitual del grupo
sanguíneo es de un 35%, 10%, 6% y un 49% para los grupos A, B, AB y O respectivamente.
En Antofagasta, se realizó el estudio en una muestra de 200 individuos obteniéndose una
distribución de 100, 60, 36, y 20 individuos para los grupos A, B AB y O respectivamente.
Verifique si la muestra de datos de la ciudad de Antofagasta se ajusta a la distribución
habitual del grupo sanguíneo en dicha ciudad usando un nivel de significación de 0.01.
2. (Aplicación en Ciencias de la Salud) Con el fin de conocer si un cierto tipo de bacterias se
distribuyen al azar en un determinado cultivo o si, por el contrario, lo hacen con algún tipo
de preferencia (el centro, los extremos, etc...), se divide un cultivo en 576 áreas iguales y se
cuenta el número de bacterias en cada área.
Los resultados son los siguientes:
no de bactérias 0 1 2 3 ≥4
no de áreas 229 211 93 35 8
¿Se ajustan los datos a una distribución de Poisson de intensidad λ? Use un nivel de
significación de 0.05
3. (Aplicación en Ciencias de la Salud) La siguiente tabla recoge la distribución de los
triglicéridos en suero, expresados en mg/dl en 90 niños de 6 años:
Nivel de triglicéridos Frecuencias
Menos de 20 5
20 – 30 11
30 – 40 15
40 – 50 24
50 – 60 18
60 – 70 12
70 o más 5
Contrastar la hipótesis de que los datos se ajustan a una distribución Normal de media μ y
varianza σ2 con un nivel de significación de 0.05
Ejercicio 1: (Aplicación en Ciencias de la ingeniería)
Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el
grado de silicosis de los trabajadores. Para lo cual se elige una muestra aleatoria de 300
trabajadores y se clasifican en la tabla siguiente:
Grado de Silicosis
Tipo de Trabajo Total
I II III
Oficina 42 24 30 96
Terreno 54 78 72 204
Total 96 102 102 300
a) Probar la hipótesis de que el tipo de trabajo afecta el grado de silicosis del trabajador
con un nivel de significación de 5%
b) Determine el grado de relación
1. (Aplicación en Ciencias de la Salud)
Una institución ambiental hizo un estudio para determinar si el sector habitacional se relaciona con
el grado de contaminación por plomo. Una muestra aleatoria de 300 personas a las que se les
examinó entregó los siguientes resultados:
Grado de Contaminaciòn
Sector Habitacional
Alto Medio Bajo
Gran Vìa 18 6 12
Goviefi 42 24 30
Playa Blanca 36 72 60
a) ¿Cree usted que el sector habitacional se relaciona con el grado de contaminación por plomo?
Use una confiabilidad de 99% en su conclusión.
b) Determine el grado de relación entre las variables analizadas e interprete el resultado.
2. (Aplicación en Ciencias del Mar) Se desea comparar la efectividad de dos análisis de
laboratorio para detectar la presencia de bacterias en equinodermos (erizo rojo), para ello
se selecciona dos muestras independientes de Loxechinus albus (erizo rojo comestible) en un
sector de caleta coloso y los resultados de los análisis fueron los siguientes:
Dirección de la Bacteria
Análisis Total
Si No
1 11 39 50
2 8 42 50
Total 19 81 100
a) Pruebe la hipótesis de que existe alguna relación entre la longitud de las truchas y el
sector del río donde fueron extraídas, usando un nivel de significación de 0.05.
b) ¿Cuál es el grado de relación entre las variables?.
EJERCICIO: (APLICACIÓN EN CIENCIAS DE LA INGENIERÍA)
En un proceso de fabricación de tornillos, el fabricante quería determinar si la proporción de
tornillos defectuosos producidos por tres máquinas variaba de una máquina a otra. Para
verificar esto se seleccionaron muestras de 400 tornillos de la producción de cada máquina y
se contó el número de tornillos defectuosos en cada una, obteniendo la siguiente tabla de
frecuencias.
Maquinas
Calidad Total
1 2 3
Defectuosos 16 24 9 49
No Defectuosos 384 376 391 1151
Total 400 400 400 1200
Rendimiento
Coeficiente Intelectual
Deficiente Regular Bueno
Bajo el Promedio 67 64 25
Promedio 42 76 56
Sobre el Promedio 10 23 37
Ciudad
Total
Lima Huacho Cañete
Estado Nutricional Obeso 82 70 62 214
Sobrepeso 93 62 67 222
Normal 25 18 21 64
Flaco 16 15 18 49