Métodos de Ajuste de Curvas

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

Mtodos de ajuste de curvas.

3.1 INTRODUCCIN
Una prueba de Bondad de Ajuste se utiliza para determinar si una poblacin tiene una distribucin terica especificada. sta prueba corresponde al rea de la denominada estadstica no paramtrica. La estadstica no paramtrica en contraste con la estadstica paramtrica no se ocupa de hacer estimaciones y pruebas de hiptesis acerca de parmetros y no depende del conocimiento de cmo se distribuye la poblacin, por ejemplo, en investigacin exploratoria, Ms an, otra ventaja es que, por lo general, los clculos necesarios son ms sencillos. Sin embargo, no podemos esperar que en el caso de una cierta distribucin, la cantidad de informacin dada por un mtodo no paramtrico sea la misma que dara un mtodo paramtrico que slo se aplica a esa distribucin especfica. Es decir, si se conoce que la distribucin es normal, una prueba paramtrica es ms eficiente que una no paramtrica. Los mtodos no paramtricos pueden ser usados para analizar datos de tipo cualitativo, ya sean ordinales o nominales; as como tambin para datos cuantitativos, mientras que los mtodos paramtricos solo pueden usarse para datos cuantitativos (discretos o continuos). Se presentarn tres pruebas no paramtricas que permitirn ajustar la distribucin emprica de los datos a una distribucin terica especfica.
2 3.2 PRUEBA G

Esta prueba se utiliza para determinar si una poblacin tiene una distribucin terica especificada. La prueba esta basada en que tan bueno es un ajuste entre la frecuencia de ocurrencia, oi, de observaciones en una muestra investigada y las frecuencias esperadas, ei , obtenidas de la distribucin terica especificada. La prueba de bondad de ajuste entre las frecuencias observadas y esperadas se basa en la cantidad:

G2 !
i !1

(oi  ei ) 2 ei

(3.1)

En donde, G es un valor de una variable aleatoria cuya distribucin muestral es muy aproximada a la distribucin chi-cuadrada con R= k -1 grados de libertad;

k es el nmero de celdas o resultados diferentes de el experimento; oi y ei son las frecuencias observadas y esperadas respectivamente para la i-sima celda . Si las frecuencias observadas son cercanas a las frecuencias esperadas correspondientes, el valor de G2 ser pequeo, indicando un buen ajuste. Ahora bien, si las frecuencias observadas difieren considerablemente de las frecuencias esperadas el valor de G2 ser grande y por lo tanto el ajuste ser pobre. Un buen ajuste en la prueba conduce a la aceptacin de Ho, mientras que un ajuste deficiente conduce a su rechazo. La regin crtica caer entonces en el extremo derecho de la distribucin chicuadrada. NOTA: Este criterio de decisin es vlido solo si ei es mayor o igual con 5. Para determinar la frecuencia esperada ei, se ocupa:

ei ! p (k i ).N

(3.2)

donde: p(ki) .-es la probabilidad de la k-sima celda, que se calcula con la distribucin terica que este siendo probada bajo la hiptesis nula.

N = 7 oi
N.- Total de observaciones en el experimento. Se proponen las siguientes etapas para llevar a cabo sta prueba:

(3.3)

Etapa 1. Establecer la hiptesis nula y la hiptesis alterna. Etapa 2. Calcular la probabilidades P(ki) por medio de la distribucin terica a probar, establecida en H0. Etapa 3. Calcular las frecuencias esperadas ei utilizando (3.2). Reagrupar las frecuencias esperadas ei en caso de requerirse (ei u5). Etapa 4. Establecer las zonas de aceptacin y de rechazo, utilizando la distribucin chi-cuadrada, considerando si se reagruparon o no clases para definir los grados de libertad. Etapa 5. Calcular el estadstico de prueba, ocupando (3.1):

G2 !

i !1

Etapa 6. Concluir segn que el valor calculado, etapa 5, haya quedado en la zona de aceptacin o de rechazo. Ejemplo 3.2.1 Se observ durante algn tiempo el nmero de accidentes sufridos por maquinistas en cierta industria, con los resultados que se muestran en la tabla

(oi

ei ) 2

ei

siguiente. Prueba, con un nivel de significancia del 1%, la hiptesis de que los datos proceden de una distribucin de Poisson con media Q = 0.45 No. de accidentes (x) 0 1 2 3 4 5 No. de maquinistas (oi) 296 74 26 8 4 4 Etapa 1. H0: El nmero de accidentes observados sigue una distribucin de Poisson. H1: El nmero de accidentes observados no sigue una distribucin de Poisson. Etapa 2. De acuerdo a H0,calcular las p(ki) ocupando la distribucin de Poisson:
P ( x, Q ) ! P (0, 0.45) ! P (1, 0.45) ! P ( 2, 0.45) ! (0.45) 0 .e 0.45 ! 0.63763 0! (0.45)1 .e 0.45 ! 0.28693 1! (0.45) 2 .e 0.45 ! 0.06456 2! Q x .e  Q x! P (3, 0.45) ! P ( 4, 0.45) ! P (5, 0.45) ! (0.45) 3 .e 0.45 ! 0.00968 3! (0.45) 4 .e 0.45 ! 0.00109 4! (0.45)5.e 0.45 ! 0.0001 5!

Etapa 3. Calcular ei ocupando (5.2), ei ! p ( k i ).N Se tiene N = 7 oi = 412 e1 = (0.63763)(412) = 262.7 e2 = (0.28693)(412) = 118.2 . . . . . . *se redondea a un decimal

Por facilidad se forma la siguiente tabla: x oi p(ki) ei 0 296 0.63763 262.7 1 74 0.28693 118.2 2 26 0.06456 26.6 3 8 0.00968 4.0 4 4 0.00109 0.5 5 4 0.0001 0.0

Una condicin es que ei u 5, por lo que se reagrupan clases, quedando las frecuencias observadas y esperadas como: oi 296 74 42 ei 262.7 118.2 31.1 Hubo necesidad de reagrupar las ltimas cuatro clases.

Etapa 4. Inicialmente k = 6, pero al reagrupar clases k = 3. Por lo que R = k-1 = 2


G 2 0.975 , 2 ! 0.0506
Zona de rechazo de H0 Zona de aceptacin de H0

G 2 0.025 , 2 ! 7.38
Zona de rechazo de H0

G2
0 0.0506 7.38

Etapa 5. Calcular el estadstico para la prueba

(oi  ei ) 2 G ! ei i !1
k 2

Se tiene:

oi ei

296 262.7

74 118.2

42 31.1

entonces:

(oi  ei ) 2 (296  262 .7) 2 (74  118 .2) 2 (42  31.1) 2 !   ! 24.6 G ! 262 .7 118 .2 31.1 ei i !1
k 2

Etapa 6. El valor calculado o estadstico de prueba ha quedado en la zona de rechazo. La conclusin es entonces, que el nmero de accidentes sufridos por los maquinistas no sigue una distribucin de Poisson

3.3 PRUEBA DE KOLMOGOROV-SMIRNOV G y el modelo Cuando se aplica la prueba de bondad de ajuste propuesto bajo Ho es continuo, es necesario aproximar la distribucin de valores mediante el agrupamiento de estos en un nmero finito de intervalos de clase. Este requisito de agrupar los datos implica tener una muestra de tamao ms o menos grande. De esta manera la prueba de bondad de ajuste chi-cuadrada se encuentra limitada cuando la distribucin estudiada es continua y la muestra aleatoria disponible tiene un tamao pequeo . Una prueba de bondad de ajuste ms apropiada que la chi-cuadrada, cuando la distribucin estudiada es continua, es la basada en la estadstica de Kolmogorov-Smirnov. La prueba de Kolmogorov_Smirnov, prueba k-s, no necesita que los datos se encuentren agrupados y es aplicable a muestras de tamao pequeo. Esta se basa en una comparacin entre las funciones de distribucin acumulativa que se observan en la muestra ordenada Fo(x) y la distribucin propuesta bajo la hiptesis nula Fe(x), dada tambin en forma acumulada. Si esta comparacin revela una diferencia suficientemente grande entre las funciones de distribucin muestral y la propuesta, entonces la hiptesis nula se rechaza. La estadstica de k-s se define por : Dn = max | Fo(x) - Fe(x) | (3.4) esto es, la diferencia mxima entre la frecuencia acumulativa observada y la frecuencia acumulativa esperada segn el modelo propuesto en Ho. La estadstica Dn tiene una distribucin que es independiente del modelo propuesto bajo la hiptesis nula. Por esta razn se dice que Dn es una estadstica independiente de la distribucin. Lo anterior da como resultado que la funcin de distribucin de Dn pueda evaluarse solo en funcin del tamao de la muestra y despus usarse para cualquier distribucin propuesta en Ho.
2

De la tabla de k-s si : Dn e D no se rechaza la hiptesis Dn " D se rechaza la hiptesis. D es el valor de la tabla de k - s Etapas para aplicar la prueba k-s. Etapa 1. Establecer las hiptesis nula y alternativa. Etapa 2. Ordenar los datos en una tabla de frecuencias para obtener Fo(x) . Etapa 3. Utilizando la distribucin terica establecida en Ho calcular Fe(x). Etapa 4. Determinar  Fo(x) - Fe(x)  para cada observacin, determinar Dn. Etapa 5. Comparar el valor Dn con el de la tabla de k-s para establecer la conclusin.

Ejemplo 5.3.1 Se obtuvieron los siguientes resultados para el punto de ebullicin, en grados centgrados, de un compuesto de silicio : 166, 141, 136, 153, 170, 162, 155, 146, 183, 157, 148, 132, 160, 175 y 150. Emplear la prueba de k-s con un nivel de significancia de 0.01 para probar la hiptesis de que los puntos de ebullicin provienen de una poblacin normal con parmetros Q = 160 rC y W = 10 rC. Etapa 1. H0: Los puntos de ebullicin del compuesto de silicio provienen de una poblacin normal con parmetros Q = 160 rC y W = 10 rC. H1: Los puntos de ebullicin del compuesto de silicio no provienen de una poblacin normal con parmetros Q = 160 rC y W = 10 rC. Etapas 2 y 3. Se tienen que formar una tabla de frecuencias para obtener la frecuencia acumulada observada F0(xi), y como est establecido en H0, para determinar la frecuencia acumulada esperada Fe(xi) se tiene que ocupar la distribucin normal. xQ , por lo que: Entonces se utiliza: z ! W x 132  160 136  160 183  160 z! ! !  1.8, z! !  1.4, . . . , z ! ! 2. 3 W 10 10 10 Con los valores anteriores y la tabla de la distribucin normal estndar, dada en forma acumulada, se encuentran los valores de Fe(xi). Etapa 4. Formar la columna  Fo(x) - Fe(x)  en la tabla de frecuencias, para determinar el valor Dn. Xi 132 136 141 146 148 150 153 155 157 160 162 166 170 175 183 f(xi) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 F(xi) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Fo(xi) 0.0667 0.1333 0.2000 0.2667 0.3333 0.4000 0.4667 0.5333 0.6000 0.6667 0.7333 0.8000 0.8667 0.9333 1.0000 z -2.8 -2.4 -1.9 -1.4 -1.2 -1.0 -0.7 -0.5 -0.3 0.0 0.2 0.6 1.0 1.5 2.3 Fe(xi) 0.0026 0.0082 0.0287 0.0808 0.1151 0.1587 0.2420 0.3085 0.3821 0.5000 0.5793 0.7257 0.8413 0.9332 0.9893  Fo(x) - Fe(x)  0.0641 0.1251 0.1713 0.1859 0.2182 0.2413 0.2247 0.2248 0.2179 0.1667 0.1540 0.0743 0.0254 0.0001 0.0107

De la tabla anterior se tiene que: Dn = 0.2413

Etapa 5. De la tabla de k-s con n = 15 y E = 0.01, se tiene D = 0.404 Como Dn < D, H0 no se puede rechazar. Por lo que se puede concluir que los puntos de ebullicin del compuesto de silicio provienen de una poblacin normal con parmetros Q = 160 rC y = 10 rC.

3.4 PRUEBA DE ANDERSON-DARLING.


La prueba de Anderson-Darling, al igual que la prueba de Kolmogorov-Smirnov, es utilizada para probar si un conjunto de datos muestrales provienen de una poblacin con una distribucin de probabilidad continua especfica (por lo general la distribucin normal). La prueba de Anderson-Darling se basa en la comparacin de la distribucin de probabilidades acumulada emprica (resultado de los datos) con la distribucin de probabilidades acumulada terica (definida en H0).

Hiptesis:
H0: La variable aleatoria en estudio sigue una distribucin normal (Q, ) H1: La variable aleatoria en estudio no sigue una distribucin normal (Q, )

Estadstico de prueba.
A2 = -n S
Si !

El estadstico de prueba, A2, est dado por: (3.5) (3.6)

( 2i  1) ?ln F (Yi )  ln(1  F (Yn1i ))A n


n

S ! Si
i !1

(3.7)

donde n es el nmero de observaciones, F(Y) es la distribucin de probabilidades acumulada normal con media y varianza especificadas a partir de la muestra y Yi son los datos obtenidos en la muestra, ordenados de menor a mayor. La hiptesis nula se rechaza con un nivel de significacin E si A2 es mayor que el valor crtico A2crit. Aunque la prueba de Anderson-Darling puede ser aplicada a cualquier distribucin continua, no se dispone de tablas para todos los casos. Se presenta enseguida la tabla (5.1) de valores crticos A2crit.para la prueba a la distribucin normal. E A2crit. 0.10 0.631 0.05 0.752 0.025 0.873 0.01 1.035

Regla de decisin:

Tabla 3.1 Valores crticos para la prueba de Anderson-Darling.

Ejemplo 3.4.1 Aplicando la prueba de Anderson-Darling, con E=5%, determina si los siguientes datos pueden ser ajustados por medio de la distribucin normal. 0.25 0.05 -0.05 -0.65 0.55 -0.15 0.50 0.00 -0.20 -0.40 0.20 -0.10 -0.40 0.10 0.70 -0.30 -0.10 -0.64 -0.04 0.26 -0.14 0.56

i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

(2i-1) Yi 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 -0.65 -0.64 -0.40 -0.40 -0.30 -0.20 -0.15 -.014 -0.10 -0.10 -0.05 -0.04 0.00 0.05 0.10 0.20 0.25 0.26 0.50 0.55 0.56 0.70

Yn+1-i 0.70 0.56 0.55 0.50 0.26 0.25 0.20 0.10 0.05 0.00 -0.04 -0.0.5 -0.10 -0.10 -0.14 -0.15 -0.20 -0.30 -0.40 -0.40 -0.64 -0.65

F(Yi) 0.0398 0.0422 0.1403 0.1403 0.2092 0.2948 0.3429 0.3529 0.3937 0.3937 0.4464 0.4570 0.5000 0.5536 0.6063 0.7052 0.7499 0.7584 0.9113 0.9310 0.9345 0.9705

F(Yn+1-i) Ln((F(Yi)) Ln(1F(Yn+1-i)) 0.9705 -3.224 -3.523 0.9345 -3.166 -2.726 09310 -1.964 -2.674 0.9113 -1.964 -2.422 0.7584 -1.564 -1.421 0.7499 -1.221 -1.386 0.7052 -1.070 -1.221 0.6063 -1.042 -0.932 0.5536 -0.932 -0.807 0.5000 -0.932 -0.693 0.4570 -0.807 -0.611 0.4464 -0.783 -0.591 0.3937 -0.693 -0.500 0.3937 -0.591 -0.500 0.3529 -0.500 -0.435 0.3429 -0.349 -0.420 0.2948 -.0288 -0.349 0.2092 -0.277 -0.235 0.1403 -0.093 -0.151 0.1403 -0.071 -0.151 0.0422 -0.068 -0.043 0.0398 -0.030 -0.041

Se utiliz (5.6) para determinar Si y se utiliza (5.7) para determinar S.


S ! S i ! ( 0.307 )  ( 0.803)  ( 1.054 )  ( 1.395)  . . .  ( 0.206 )  ( 0.138) ! 22.253
i !1 n

Con (3.5) ya se puede determinar el estadstico de prueba A2: A2 = -n S = -22 (-22.253) = 0.253 De la tabla 3.1 con E=5%, se lee un valor crtico A2crit. = 0.752.

A partir de la muestra se especifica: Q = 0.0 y

= 0.3708 Si -0.307 -0.803 -1.054 -1.395 -1.221 -1.304 -1.354 -1.346 -1.344 -1.404 -1.353 -1.437 -1.356 -1.340 -1.233 -1.084 -0.956 -0.813 -0.411 -0.395 -0.206 -0.138

Como A2 < A2crit.,la hiptesis nula no se puede rechazar. Por lo que, se concluye que los datos observados pueden ser ajustados por medio de la distribucin normal

También podría gustarte