Chi Cuadrado
Chi Cuadrado
Chi Cuadrado
cuadrado y contrastes
asociados ING. RAÚL ALVAREZ GUALE, MPC
Estimación de Intervalos y
Prueba de Hipótesis para
Varianzas Poblaciones
Prueba de Hipótesis
para Varianzas
Estadístico de prueba
Estadístico de prueba F
Chi-cuadrado
Caso de una Varianza
Poblacional
Los casos que involucran una varianza
poblacional emplean uno de dos procedimientos
estadísticos:
Prueba de hipótesis
Estimados de intervalos de confianza
El gerente de un banco puede creer que la
varianza poblacional del tiempo de servicio al
cliente es no mayor a 36 minutos al cuadrado. Se
plantea la hipótesis nula que la varianza es mayor
o igual a 36 min2 y, en base a data muestral, se
debe estar en capacidad de rechazar o no la
hipótesis nula.
Caso de una Varianza
Poblacional
Un gerente requiere tomar una muestra de los
clientes del restaurante para determinar el número
de veces al mes que cenan fuera de casa. Para
esto requiere determinar el tamaño de la muestra,
lo cual depende de la varianza poblacional.
Puede tomar una muestra piloto y construir un
intervalo de confianza para la estimación de la
varianza poblacional.
Lo ideal serían pruebas sobre la desviación estándar, sin
embargo no se disponen de las mismas, se debe recurrir
a pruebas sobre la varianza para a partir de las mismas
inferir sobre la desviación estándar.
(n 1)s 2
2
σ 2
Donde
2 = Variable chi-cuadrada estandarizada
n = Tamaño de muestra
s2 = Varianza muestral
El estadístico de prueba estandariza
σ2 = Varianza (supuesto) la varianza muestral (similar a los
estadísticos z y t de los capítulos
anteriores)
Gráfico de la Distribución
Chi Cuadrado
Hallando el Valor Crítico
El valor crítico, , puede obtenerse de la Tabla Chi-cuadrado
2
Prueba Unilateral
Derecha:
H0: σ2 ≤ σ02
HA: σ2 > σ02
0 2
No rechazar H0 Rechazar H0
2
Distribución Chi-cuadrado
La distribución chi-cuadrado es una familia de distribuciones, que
depende de los grados de libertad:
g.l. = n – 1
0 4 8 12 16 20 24 28 2 0 4 8 12 16 20 24 28 2 0 4 8 12 16 20 24 28 2
2 = 24.9958
= 0.05
0 2
No rechazar H0 Rechazar H0
Estadístico de prueba:
(n 1)s 2 (16 1)24
2
22.5
σ 2
16
Decisión: Como 2 = 22.5 < 24.9958 = , no rechazamos H0
2
/2
/2
0 2 0 2
Rechazar No rechazar H0 Rechazar No rechazar Rechazar H0
H0 H0 H0
21- 1-/2
2 2/2
(2L) (2U)
Ejemplo
Una congeladora comercial debe mantener
la temperatura seleccionada con poca
variación. Las especificaciones indican que la
desviación estándar no debe ser mayor a 4
grados (o la varianza a 16 grados2).
Una muestra de 16 datos
es evaluada y da una varian-
za muestral de s2 = 24. Evalúe
si la desviación estándar espe-
cificada ha sido excedida. Use
= 0.05.
Problema 1
Un fabricante de baterías para automóvil garantiza que su
producto durará, en promedio 3 años con una desviación
estándar de 1 año. Si cinco de estas baterías tienen duraciones
de 1.9, 2.4, 3.0, 3.5 y 4.2, ¿el fabricante continuará convencido
de que sus baterías tienen una desviación estándar de 1 año?
Suponga que las duraciones de las baterías tienen una
distribución normal.
Solución
Datos:
𝜎=1
𝑛=5
1
𝑆2 = 5 1.92 + 2.42 +32 +3.52 + 4.22 − 152 = 0.815
5 4
Solución: Problema 1
Se declaran las hipótesis
Ho: 𝜎=1
H1: 𝜎 ≠1
Se determinan los estadísticos-comprobación
𝑛 − 1 𝑆2
𝑋2 =
𝜎2
5 − 1 (0.815)
𝑋2 =
1
𝑋 2 = 3.26
Solución: Problema 1
Con un nivel de significancia del 5%: No existe
evidencia de que la duración de las baterías no sea
de un año
Problema 2
El proceso de bruñido (que se utiliza para desbastar
ciertas obleas de silicio al grosos adecuado) es
aceptable solo si 𝜎, la desviación estándar poblacional
del grosor del cubo cortado de las obleas, es cuando
mucho 0.50 mil. Use el nivel de significancia de 0.05 para
probar la hipótesis nula 𝜎=0.50 contra la hipótesis
alternativa 𝜎>0.50, si el grosor de 15 cubos cortados de
tales obleas tienen una desviación estándar de 0.64 mil.
Solución
Datos:
𝜎 = 0.5
𝑛 = 15
𝑆 = 0.64
Solución: problema 2
Se declaran las hipótesis
Ho: 𝜎=0.50
H1: 𝜎>0.5
Se determinan los límites de confianza
Se rechaza la hipótesis nula si X2>23.685 para un 𝑋0.05
2
para
14 grados de libertad
Solución: problema 2
Solución: problema 2
Se determinan los estadísticos-comprobación
2
𝑛 − 1 𝑆
𝑋2 =
𝜎2
15 − 1 (0.64)2
𝑋2 =
(0.50)2
𝑋 2 = 22.94
2 𝑘
( 𝑜𝑖𝑗 − 𝑒𝑖𝑗 )2
𝛸2 =
𝑒𝑖𝑗
𝑖=1 𝑗=1
Problema 3:
Muestras de tres tipos de materiales, sometidos
a cambios extremos de temperatura, dieron los
resultados que se presentan en la siguiente
tabla:
𝐻0 : 𝑝1 = 𝑝2 = ⋯ = 𝑝𝑘 = 𝑝
Material Materi Material Total
A al B C
Desmonorami 41 27 22 90
ento
Permanece 79 53 78 210
Intacto
Total 120 80 100 300
Solución Problema 3:
Se plantean las hipótesis
𝐻0 : 𝑝1 = 𝑝2 = 𝑝3
𝐻1 : 𝑝1 , 𝑝2 𝑦 𝑝3 𝑛𝑜 𝑠𝑜𝑛 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Establecer los límites de confianza
Rechazar la hipótesis nula
Si 𝛸 2 > 5.991, oara el valor de 𝛸0.05
2
𝑝𝑎𝑟𝑎 3 − 1 =
2 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
Se determinan los número esperados de éxito y fracasos
( 41 − 36 )2 ( 27 − 24 )2 ( 22 − 30 )2
𝛸2 = + + +
36 24 30
( 79 − 84 )2 ( 53 − 56)2 ( 78 − 70)2
+ + = 4.575
84 56 70
Se toma una decisión: dados que 𝛸 2 =4.575 no supera
5.991, la hipótesis nula no puede rechazarce.
Forma resumida de Cálculos
(50)(80)
𝑒21 = 𝑒21 = 𝑒21 = 𝑒21 = = 20
200
Se determina el estadístico
2 𝑘 2
( 𝑜𝑖𝑗 − 𝑒𝑖𝑗 )
𝛸2 =
𝑒𝑖𝑗
𝑖=1 𝑗=1
𝛸2
( 31 − 30 )2 ( 42 − 30 )2 ( 22 − 30 )2 ( 25 − 30 )2
= + + + +
30 30 30 30
/2
/2
21-/2 2/2 2
(2L) (2U)
(n 1)s 2 (n 1)s 2
Donde 2L y 2U pertenecen a la σ 2
distribución 2 con n -1 grados de
libertad
χU
2
χL2
Intervalo de Confianza: Ejemplo
/2=0.025 /2=0.025
20.975 20.025
(2L) 6.2621 27.4884 (2U)
(n 1)s 2 (n 1)s 2 (16 1)24 (16 1)24
σ
2
σ2 13.096 σ 2 57.489
χ U2 χ L2 27.4884 6.2621
¿Cómo proceder?
Bondad de Ajuste
Ejemplos:
¿Las llamadas al soporte técnico tienden a
ser iguales todos los días de la semana? (¿Las
llamadas siguen una distribución uniforme?)
¿Las medidas en un proceso de producción
siguen una distribución normal?
Prueba Chi-cuadrado de Bondad
de Ajuste (continuación)
¿Las llamadas al soporte técnico tienden a ser iguales
todos los días de la semana? (Es decir: ¿Las llamadas
siguen una distribución uniforme?).
Para cada día de la semana se tomó una muestra de
10 días:
Total de llamadas (muestra):
Lunes 290
Martes 250
Miercoles 238
Jueves 257
Viernes 265
Sábado 230 Total = 1722
Domingo 192
Lógica de la Prueba Chi-cuadrado
de Bondad de Ajuste
Si las llamadas estuvieran uniformemente dis-
tribuidas, se esperaría que las 1,722 llamadas se
distribuyan equitativamente en los 7 días:
1,722
246 llamadas esperadas por día
7
Prueba chi-cuadrado de bondad de ajuste: Evalúa
si los resultados muestrales son consistentes con los
resultados esperados.
(Es decir, datos observados = datos esperados)
Frecuencias Observadas vs.
Esperadas
Observado Esperado
oi ei
Lunes 290 246
Martes 250 246
Miercoles 238 246
Jueves 257 246
Viernes 265 246
Sábado 230 246
Domingo 192 246
Total 1,722 1,722
Estadístico de prueba chi-
cuadrado
H0: La distribución de llamadas es uniforme respecto
a los días de la semana (observado = esperado)
HA: La distribución de llamadas no es uniforme
( o e ) 2
2 i i
ei
0 2
No rechazar H0 Rechazar H0
2
(con k-1 grados de libertad)
Rechazar H0 si
2 2
α
Estadístico de Prueba Chi-
Cuadrado
H0: La distribución de llamadas es uniforme respecto a los días de la semana
HA: La distribución de llamadas no es uniforme
= 0.05
0 No rechazar H0 Rechazar H0
2
Estadístico de prueba:
(290 246)2 (250 246)2 (192 246)2
2
... 23.05
246 246 246
Decisión: Como 2 = 23.05 > 2 = 12.5916 entonces se rechaza H0
Conclusión: Hay suficiente evidencia para concluir que la distribución no sea uniforme
Prueba Chi-cuadrado de Bondad
de Ajuste: Pasos
1. Formular hipótesis
2. Fijar el nivel de significancia
3. Determinar el valor crítico
4. Calcular el estadístico de prueba, 2
5. Tomar una decisión
6. Interpretar el resultado
Ejemplo: Distribución Normal
¿Las medidas obtenidas de un proceso de
producción siguen una distribución normal con
μ = 50 y σ = 15?, = 0.05.
Proceso:
Obtener datos muestrales.
Agrupar los datos muestrales en clases
(celdas). La frecuencia esperada en cada
celda debe ser al menos 5.
Comparar las frecuencias observadas
(datos muestrales) con las frecuencias
esperadas.
Ejemplo: Distribución Normal
(continuación)
Datos muestrales y agrupados en clases:
Región de Rechazo:
2
14.0671 = 0.05 (7 g.l., 8 clases)
=0.05
0 No rechazar H0 Rechazar H0 2
Estadístico de prueba:
(oi ei ) 2 (10 13.68) 2 (2 0.57) 2
2
... 12.057
ei 13.68 0.57
Preferencia manual
Tamaño muestral n =300
Género Izquierda Derecha
De 120 mujeres, 12
son zurdas
Femenino 12 108 120
De 180 hombres, 24
son zurdos Masculino 24 156 180
36 264 300
Lógica de la Prueba
Preferencia manual
Género Izquierda Derecha
Observado = 12 Observado = 108
Femenino 120
Esperado = 14.4 Esperado = 105.6
Observado = 24 Observado = 156
Masculino 180
Esperado = 21.6 Esperado = 158.4
36 264 300
r c (oij eij )2
2
con g.l. (r 1)(c 1)
i1 j1 eij
Donde:
oij = Frecuencia observada en la celda (i, j)
NOTA: Todas las
eij = Frecuencia esperada en la celda (i, j) filas y columnas
r = Número de filas deben ser usadas
c = Número de columnas
Estadístico de Prueba
Chi-cuadrado (continuación)
Preferencia manual
Género Izquierda Derecha
Observado = 12 Observado = 108
Femenino 120
Esperado = 14.4 Esperado = 105.6
Observado = 24 Observado = 156
Masculino 180
Esperado = 21.6 Esperado = 158.4
36 264 300
Regla de decisión:
Si 2 > 3.841,
rechazar H0;
3.841= 20.05, g.l.=(r-1)(c-1)=1
en otro caso,
no rechazar H0 = 0.05
No rechazar H0 Rechazar H0
2
Estadístico de prueba: 0.7576
Decisión: Como 2 = 0.7576 < 3.841, no se rechaza H0
Conclusión: No hay suficiente evidencia para concluir que el género y la
preferencia manual no son independientes
Prueba Chi-cuadrado:
Consideraciones
La distribución chi-cuadrado es solamente
una aproximación de la verdadera
distribución
Pero es aceptable cuando todas las frecuencias esperadas
son mayores que o iguales a 5
Cuando las frecuencias son menores que 5, el valor del
estadístico de prueba chi-cuadrado podría incrementar la
probabilidad del error tipo I
Como regla, si la hipótesis nula no es rechazada, acepte el
resultado así se tenga celdas con frecuencias esperadas
menores a 5.9.