Prueba de Bondad de Ajuste
Prueba de Bondad de Ajuste
Prueba de Bondad de Ajuste
Supongamos que tenemos un número k de clases en las cuales se han ido registrado un total
de n observaciones (n será pues el tamaño muestral). Denotaremos las frecuencias
observadas en cada clase por O1, O2, ..., O k (Oi es el número de valores en la clase Ai ).
Se cumplirá:
O1 + O2 + ... + O k = n
Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas
(teóricas), a las que denotaremos por E1, E2, ..., E k . Se cumplirá:
E1 + E2 + ... + E k = n
Se tratará ahora de decidir si las frecuencias observadas están o no en concordancia con las
frecuencias esperadas (es decir, si el número de resultados observados en cada clase
corresponde aproximadamente al número esperado). Para comprobarlo, haremos uso de un
contraste de hipótesis usando la distribución Chi-cuadrado: El estadístico de contraste
Observar que este valor será la suma de k números no negativos. El numerador de cada
término es la diferencia entre la frecuencia observada y la frecuencia esperada. Por tanto,
cuanto más cerca estén entre sí ambos valores más pequeño será el numerador, y viceversa.
El denominador permite relativizar el tamaño del numerador. Las ideas anteriores sugieren
que, cuanto menor sean el valor del estadístico ∗ χ2, más coherentes serán las
observaciones obtenidas con los valores esperados. Por el contrario, valores grandes de este
estadístico indicarán falta de concordancia entre las observaciones y lo esperado. En este
tipo de contraste se suele rechazar la hipótesis nula (los valores observados son coherentes
con los esperados) cuando el estadístico es mayor que un determinado valor crítico.
Notas:
(1) El valor del estadístico ∗ χ2 se podrá aproximar por una distribución Chi-cuadrado
cuando el tamaño muestral n sea grande (n > 30), y todas las frecuencias esperadas
sean iguales o mayores a 5 (en ocasiones deberemos agrupar varias categorías a fin de
que se cumpla este requisito).
(2) Las observaciones son obtenidas mediante muestreo aleatorio a partir de una población
particionada en categorías.
Un experimento multinomial es la generalización de un experimento binomial: 1. Consiste
en n pruebas idénticas e independientes. 2. Para cada prueba, hay un número k de
resultados posibles. 3. Cada uno de los k posibles resultados tiene una probabilidad de
ocurrencia pi asociada (p1 + p2 + ... + pk = 1), la cual permanece constante durante el
desarrollo del experimento. 4. El experimento dará lugar a un conjunto de frecuencias
observadas (O1, O2, ..., Ok) para cada resultado. Obviamente, O1 + O2 + ... + Ok = n.
En ocasiones estaremos interesados en comparar los resultados obtenidos al realizar un
experimento multinomial con los resultados esperados (teóricos). Ello nos permitirá saber
si nuestro modelo teórico se ajusta bien o no a las observaciones. Para ello, recurriremos a
la distribución Chi-cuadrado, la cual nos permitirá realizar un contraste sobre la bondad del
ajuste.
Concretamente, usaremos el estadístico
Para realizar el contraste de Bondad de Ajuste debemos calcular las frecuencias esperadas
de cada suceso bajo la hipótesis de uniformidad entre los valores. Si la selección del canal
fuera aleatoria, todos los canales tendrían la misma probabilidad de selección y por lo tanto
la frecuencia esperada de bebidas vendidas en cada uno de ellos debería ser
aproximadamente la misma. Como se han vendido en total 70 refrescos, la frecuencia
esperada en cada canal es:
Este valor debemos compararlo con el valor crítico de la distribución 2 χ con (4-1)=3
grados de libertad. Este valor es: 0.95 (3) 7.81 2 χ = Puesto que el valor del estadístico
(2.34) es menor que el valor crítico, no podemos rechazar la hipótesis de que los datos se
ajustan a una distribución uniforme. Es decir, que los canales son seleccionados
aleatoriamente entre los consumidores.
“PRUEBAS DE INDEPENDENCIA”
… … … … …
…
C1 C2 … Cj N
TOTAL
… … … …
Conclusión:
a). SiX 20 , pertenece a RA, entonces aceptar H0 o rechazar H1
2
b) Si X 0 , pertenece a RR, entonces rechazar H0 o aceptar H1
Ejemplo: Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se
seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados. Las
interrogantes fueron:
Practica algún deporte: SI: ---; NO:….; Sufre de depresión: SI:…; NO: ….. Al ordenarse
los datos, se obtiene: