50 Minaard PDF
50 Minaard PDF
50 Minaard PDF
INTRODUCCIN En el anlisis de regresin2 una de las dos variables, que llamamos X, puede considerarse como variable ordinaria, es decir se puede medir sin error apreciable. La otra variable Y, es una variable aleatoria. A X se la llama variable independiente (algunas veces variable controlada) y nuestro inters es la dependencia de Y en trminos de X. Supongamos que en cierto experimento aleatorio tratamos de manera simultnea dos variables, una variable ordinaria X y una variable aleatoria Y. Efectuamos el experimento de tal manera que
Trabajo aceptado para ser presentado en forma oral en el IICaim Segundo Congreso Argentino de Ingeniera Mecnica. San Juan, Argentina. Noviembre 2010 2 Este trmino lo sugiri la observacin de Galton que en promedio los hijos de padres altos no son tan altos como sus padres y los hijos de padres bajos no son tan bajos como sus padres, as que existe la tendencia a regresar hacia la media. El trmino correlacin fue tambin propuesto por Galton (Proceedingd of the Royal Society of London, 45, 1888). En: http://rspl.royalsocietypublishing.org/content/by/year/1888
1
20
x j obtenemos un valor
f ( x, a ) = a 0 + a1 x
b) Cuadrticas
a = (a 0 , a1 ) a = (a 0 , a1 , a 2 )
f (a, x) = a 0 + a1 x + a1 x 2
c) En general de grado menor o igual a m
f ( x, a ) = a 0 .x a1
iii) Exponenciales
a = (a 0 , a1 ) a = (a 0 , a1 )
f ( x, a ) = a 0 .(a1 ) x
iv) Logartmicas
f ( x, a ) = a 0 + a1 ln x
a = (a 0 , a1 )
21
Ya elegida la clase de funciones C = { f ( x, a ) / a A } nos falta determinar en la misma alguna que describa los valores dados. Para realizar tal propsito necesitamos un criterio, utilizaremos aqu el llamado mtodo de mnimos cuadrados. Diversos autores (Sotomayor et al. (2002); Mendenhall et al. (2004), Garca (2004), Montgomery el al. (2002)) describen el mtodo.
n
Grfico 1
Tenemos que para cada valor de i = 1,2, ,n observado y el obtenido a travs de la funcin
i = Yi f ( xi , a)
n n
Si los puntos ( x1 , y1 ), ( x 2 , y 2 ),..................., ( x n , y n ) pertenecen a la grfica de f entonces Sa = 0 y recprocamente. Si eso no ocurre debemos procurar que dicha funcin tome el valor mnimo. En general tal . Entonces la funcin que elegimos es la funcin mnimo se alcanza para un nico valor de a
: Determinacin de a
Recordemos que para que S tenga un mnimo en el punto a debe ocurrir
Sa = 0 a j
2 (Yi f ( xi , a ))
i =1
f ( xi , a ) = 0 a j
De donde resulta
i =1
n f ( xi , a )) f ( xi , a ) = Yi f ( xi , a ) a j a j i =1
j =0,1,...,m
Desarrollando las sumatorias resulta un sistema de ecuaciones normales cuya solucin es el vector buscado a
REGRESIN LINEAL Aplicar el mtodo de mnimos cuadrados utilizando las herramientas que nos proporcionan las Tics resulta sencillo. Tomemos un ejemplo: En la produccin de herramientas, el mtodo para deformar acero a temperatura normal mantiene una relacin inversa con la dureza del mismo ya que, a medida que la deformacin crece, se ve afectada la dureza del acero. Para investigar esta relacin se ha tomado la siguiente muestra:
X: deformacin (en mm) Y : dureza Brinell (en kg/mm2)
6 68
9 67
11 65
13 53
22 44
26 40
28 37
33 34
35 32
23
Representamos mediante un diagrama de dispersin indicando la recta de regresin, su ecuacin y el coeficiente de determinacin correspondiente.3
ANALISIS DE LA VARIANZA Siendo y = a + bx la recta de regresin lineal, el parmetro b se llama coeficiente de regresin. Su valor expresa el incremento de
crece al crecer x , y en consecuencia la recta es creciente, lo que indica que la la variable y dependencia entre las variables es directa. decrece al crecer x , y en consecuencia la recta es y decreciente, lo que indica que la dependencia entre las variables es inversa. Si b = 0 , la recta es
Si b toma un valor negativo, la variable horizontal y no hay dependencia entre las variables, ya que las variaciones de x no provocan . variacin de y
3
Tanto el diagrama de dispersin como la recta de regresin fueron representados mediante Excel 2007.
24
Es muy interesante ver que los mtodos de anlisis de la varianza tambin pueden aplicarse en relacin con problemas de regresin. Utilizando el software XLStat4 aplicamos el anlisis de la varianza a los datos de la Tabla 1. Prueba de la hiptesis = 0 contra la alternativa 0 ( : coeficiente de regresin de la poblacin) Anlisis de la varianza:
GDL 1 7 8
F 149,132
Como F = 149,132 > 0,001 se rechaza la hiptesis nula, por lo tanto 0 Parmetros del modelo: Desviacin tpica 2,460 Lmite inferior Lmite superior (95%) (95%) 69,899 -1,575 81,541 -1,064
t 30,779
0,108 -12,212
Tabla 3: Parmetros del modelo lineal e intervalos de confianza del 95% para el coeficiente de regresin y la ordenada al origen
Ver en http://www.xlstat.com/
25
EL COEFICIENTE DE DETERMINACION Se define el coeficiente de determinacin como la parte relativa de la variacin total que viene explicada por el modelo.
y) 2 (y R = 2 Sy
2
El coeficiente de determinacin toma valores entre 0 y 1. ( 0 R 1 ). Todo ajuste mnimo cuadrtico debe venir acompaado de su respectivo coeficiente de determinacin para poder conocer el poder representativo de la funcin de ajuste, es decir el valor explicativo del modelo.
2
Si R > 0,90 se acepta el ajuste, en caso contrario se debe buscar otro modelo.
2
Para el ejemplo propuesto R = 0,955 > 0,90 por lo tanto la regresin lineal es un muy buen ajuste.
2
REGRESIONES NO LINEALES Si bien la regresin lineal es un muy buen ajuste para el problema propuesto, aplicaremos otros tipos de regresiones a fin de poder comparar. Cuadrtica
26
Potencial
Exponencial
27
Logartmica
Compararamos las regresiones aplicadas Tipo de regresin Lineal Cuadrtica Potencial Exponencial Logartmica Coeficiente de determinacin 0,955 0,971 0,941 0,978 0,955
28
El mejor ajuste es a travs de una funcin exponencial ( R = 0,978) , seguido por la regresin
2
cuadrtica ( R = 0,971) , si bien se puede observar que los dos valores anteriores estn muy cerca uno del otro.
2
CONCLUSIONES La aplicacin de distintas regresiones sobre un mismo problema nos permite realizar comparaciones, sin limitarse solamente al caso lineal. La facilidad de que nos brindan las nuevas tecnologas permiten en poco tiempo efectuar comparaciones que nos permitan la correcta eleccin de un modelo adecuado, que describa los datos en problemas de ingeniera, as como nos proporciona elementos de juicio suficientes para la toma de decisiones en condiciones de incertidumbre.
REFERENCIAS BIBLIOGRFICAS Velasco Sotomayor,G. ; Wisniewski, P.(2002) Probabilidad y Estadstica para Ingeniera y Ciencias. Editorial Thomson. Mendenhall,W. ; Wackerly,D.; Sheaffer, R.(2004) Estadstica Matemtica con Aplicaciones. Grupo Editorial Iberoamrica. Garca, R. (2004). Inferencia estadstica y diseo de experimentos. Buenos Aires: Eudeba. Montgomery,D. ; Peck,E. y Vinning, G. (2002). Introduccin al Anlisis de Regresin Lineal. Editorial C.E.C.S.A.
29