GOF Easyfit
GOF Easyfit
GOF Easyfit
Cuando se pueda construir un histograma que contribuya a establecer una buena hi-
ptesis sobre el patrn aleatorio que subyace en una muestra, entonces es convenien-
te utilizar algn procedimiento de ajuste basado en la comparacin de las frecuencias
observadas y las esperadas bajo la hipottica distribucin de probabilidades. Uno de
estos procedimientos es la prueba de Karl-Pearson o prueba Chi-Cuadrado, descrito en
la fig. 1. La hiptesis nula (H0) es "el patrn aleatorio es f(x)", en donde f(x)
es la regla funcional de la distribucin de probabilidades de la variable de inters (de
la que supuestamente proviene la muestra).
PRUEBA DE KARL-PEARSON (o CHI-CUADRADA)
k
( Obs i Esp i ) 2
Estadgrafo: J=
i =1 Esp i
en donde:
Obs i = Frecuencia observada (la contada en la muestra) en la clase i
Espi = Frecuencia esperada (segn la hiptesis nula) de la clase i
k = # clases que satisfacen los requisitos.
Requisitos: Cada frecuencia esperada debe ser superior a 5 (aunque, siendo
menos exigentes, es suficiente usar 1 en vez de 5). Cuando no se
cumpla, se juntan las clases adyacentes que sean necesarias.
Valor Crtico:
2 ; k p 1
"p" es el nmero de parmetros de la distribucin
hipottica estimados de la muestra.
Criterio: Rechazar la hiptesis (H0) solamente cuando el
estadgrafo resulte mayor que el valor crtico.
Para probar que el tiempo de moldeado es Normal, hay que estimar sus
parmetros, que son la media y la deviacin tpica, los cuales pueden dejarse como se
obtengan de la muestra aunque lo ms recomendable es ajustarlos a valores ms
probables.
Parmetro Estimador Valor Ajustado
Media Media muestral 24.9657 25
Desv Std Desv Std muestral 3.0825 3.1
Ahora, la hiptesis de normalidad se somete a la prueba Chi-Cuadrado; adems,
en el anlisis se incluye una segunda opcin de ajuste del tiempo de moldeado: la
distribucin Gamma a fin de ilustrar dos aspectos distintos de la Normal: 1) La
Gamma es una distribucin no negativa de 2 parmetros: forma (k) y escala (), pero
tambin de 3 parmetros en caso de no iniciar en cero: forma (k), escala () y
localizacin (). 2) Mostrar la manera de estimar los parmetros de forma y escala.
Aunque la prueba Chi-Cuadrado es relativamente sencilla de ejecutar en una
hoja electrnica de clculo, aqu se expone cmo realizarla con el software
especializado EasyFit (versin de prueba).
Primero se presenta la estimacin de los parmetros de forma y escala de la
densidad de probabilidades Gamma (fig. 3).
fig. 3 Estimacin de parmetros de la distribucin Gamma
Ahora s, las hiptesis a contrastar de cada patrn son:
NORMAL
H0: el tiempo de moldeado de una olla es Normal con media de
25 minutos y desviacin estndar de 3.1 minutos
H1: el tiempo de moldeado de una olla NO es Normal con media de
25 minutos y desviacin estndar de 3.1 minutos
GAMMA
H0: el tiempo de moldeado de una olla es Gamma con parmetro de
forma 65.6 y de escala 0.38.
H1: el tiempo de moldeado de una olla NO es Gamma con parmetro de
forma 65.6 y de escala 0.38.
PRUEBA DE BONDAD DEL AJUSTE CON EasyFit
En EasyFit se escogen solamente los ajustes Normal y Gamma.
Ficha "Generales": habilitar solamente "Chi-cuadrado" (y clases de "Ancho igual").
Pulsar sobre el botn Guardar y enseguida OK.
En el desglose del men Analizar se escoge Ajustar distribuciones ...
Del rbol de la izquierda en la GUI (seccin "Tablas de datos disponibles"), seleccionar
la muestra a ajustar y en la seccin "Muestra" asegurarse que el nombre de la muestra
y el dominio sean los correctos:
Al pulsar OK aparece una ventana con los resultados:
NOTA: Si el pequeo recuadro que se ve arriba a la derecha no aparece, pulsar en He-
rramientas (abajo, a la izquierda) y seleccionar Opciones, Mostrar parmetros.
En cada grfico se modifican los parmetros que calcula EasyFit por los que se ajusta-
ron en el anlisis previo (se pulsa la "palomita" verde para aplicar los cambios). Ad-
virtase que en vez de que el analista se encargue de estimar los parmetros de cada
uno de los patrones aleatorios a contrastar asunto que en algunas distribuciones es
complicado, pueden ajustarse los que EasyFit reporte.
Tambin en la Gamma de 3 parmetros que EasyFit ajusta automticamente cuando se
selecciona la distribucin Gamma (tambin suceder esto con Exponencial, Erlang,
Weibull, ...), se ajustan un poco los parmetros.
Pulsar ahora sobre la pestaa "Bondad de ajuste":
EasyFit clasifica los ajustes: 1 es el
mejor, 2 el segundo mejor, etc. En este
caso el mejor ajuste es el Normal.
Al pulsar sobre el nombre de la variable en la columna "Distribucin" de este reporte,
aparece ms informacin, que permite aceptar o no el que EasyFit marca como mejor
ajuste. Por lo comn el nivel de significacin es 5%, as que hay que fijarse ms en el
resultado de la prueba con ste que con los dems:
Al 5% de significacin NO se rechaza la hiptesis
de que el tiempo de moldeado es Normal con
promedio de 25 minutos y deviacin estndar de
3.1 minutos.
CONCLUSIN:
El tiempo de moldeado de una olla puede ser si-
mulado por un patrn Normal con media de 25
minutos y desviacin estndar de 3.1 minutos
Ajuste de muestras pequeas
Cuando se disponga de una muestra cuyo tamao no sea suficiente para construir un
histograma de al menos 5 clases que ayude a identificar posibles patrones de ajuste, se
considerar que es pequea y no ser aplicable la prueba Chi-Cuadrado. Para ajustar
muestras pequeas de variables continuas, EasyFit tiene las pruebas de Kolmogrov-
Smirnov (KS) y de Anderson-Darling (AD).
Considrese este caso: antes de moldear la olla el artesano prepara y acomoda
el torno que utiliza. Se ha obtenido la siguiente muestra del tiempo de preparacin
(minutos):
3.64 4.71 4.13 3.60 3.59 3.69 4.95 3.95 4.77 3.17 4.70 3.53 4.08 3.06 3.92
La muestra es claramente pequea y para establecer alguna hiptesis sobre su
distribucin se recurre a la naturaleza de los datos y a algunos sondeos de la misma.
Por naturaleza (operacin repetitiva hecha por humano) podra ser Normal o Unifor-
me. Por la exploracin de la muestra:
# datos, n = 15
Promedio = 3.97 No puede ser la Exponencial u otra de
Desv Std = 0.5887 variabilidad alta.
Mnimo = 3.06
Mximo = 4.95 Puede ser Normal o Uniforme
# datos arriba del promedio = 6 Parece tratarse de una distribucin
# datos abajo del promedio = 9 simtrica.
Los patrones potencialmente buenos son el Normal y el Uniforme. Se estiman sus pa-
rmetros con base en esta exploracin de los datos:
Ajuste Parmetros
Normal Media = 4 minutos y Desv Std = 0.6 minutos
Uniforme Valor mnimo = 3 minutos; y valor mximo = 5 minutos
En EasyFit se procede de manera similar a la del tiempo de moldeado, pero en vez de
habilitar la prueba Chi-Cuadrado se escogen las pruebas KS y AD.
Se captura la muestra en el mismo archivo de EasyFit, en el que ahora hay dos tablas:
la del tiempo de moldeado (TpoMold) y la del tiempo de preparacin (TpoPrep); se
escoge la de ste ltimo:
Aunque EasyFit
presenta histo-
gramas, en reali-
dad son intiles,
dado el pequeo
tamao de la
muestra.
Reporte de salida de la prueba
La prueba de KS prefiere el ajuste
Normal sobre el Uniforme pero la de
AD es al contrario: pone en primer lu-
gar el ajuste Uniforme y luego el Nor-
mal. En ambas pruebas, los ajustes
Normal y Uniforme son buenos al 5%
de significacin.
Revisando los estadgrafos ("Estadsti-
ca" en el reporte) de ambas pruebas la
diferencia en la de KS es casi nada:
0.16397 y 0.16833, mientras que es
ms notoria, a favor de la Uniforme, en
la de AD: 0.47822 y 0.38493. Por esta
razn, se prefiere el ajuste Uniforme al
Normal.
CONCLUSIN:
El tiempo de preparacin de una olla
puede ser simulado por un patrn
Uniforme de 3 a 5 minutos.
Las pruebas de K-S y de A-D son complementarias debido a que la primera es buena
para detectar desviaciones importantes respecto del centro de la distribucin en tanto
que la segunda lo es para los extremos.