Esquemas Estadística Uned

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 3

UED Tudela Introducción al Análisis de Datos

Esquema tema 8: Regresión y correlación.

8.1 y 8.2.- Introducción y objetivos.


- Diseños ex post facto: la variable independiente no se puede manipular (ya se ha obtenido un valor junto al de
la v.d.)
- Estudio del grado de dependencia de dos (o más) variables cuantitativas.
- Ver ejemplo con una v.i.
- Regresión y correlación simple ( una sola v.i.) vs. regresión y correlación múltiple.

8.3.- Correlación y regresión simple.


- Ejemplo previo:
- Diagrama de dispersión. Aproximación a una función.
1ª cuestión: ¿Cuál es el grado de correlación entre las dos notas?
2ª cuestión: ¿Podemos predecir Y dado un valor de X?

1ª cuestión: Coeficiente de correlación de Pearson: rXY


Propiedades:
a) Está comprendido entre -1 y 1
b) Si rXY = ±1 puntos están sobre una recta. Además, cuanto más próximo esté a 1 ó a -1, más próximos
estarán los puntos a una recta.
c) Si rXY>0, la recta es creciente y si rXY<0, la recta es decreciente.

8.3.1.- Coeficientes de regresión lineal simple: B y B0


2ª cuestión. Si el grado de correlación es alto, ¿qué recta ajustaremos? Y=BX+B0
- Procedimiento de mínimos cuadrados
Residuo o error: ε = Y - Y'
Los valores de B y B0 que hacen que la suma de los cuadrados de los residuos sea mínimo son:
S S
B= XY = r XY Y y B0 = Y − BX
SX² SX

Recta de regresión en puntuaciones diferenciales: y=Bx (B es el mismo que en puntuaciones directas)

Recta de regresión en puntuaciones típicas: z=rxyzx

8.3.2.- Bondad del ajuste


Se cumplen las siguientes propiedades:

a) Y = Y' + ε
b) SY2 = SY'2 + Sε2
c) La media de ε es cero y las medias de Y e Y' coinciden.
SY2'
2
d) rXY = = Coeficiente de determinación. Al complementario se le llama coeficiente de alienación.
SY2
Error típico de estimación

En la muestra: Se =
∑ (Y − Y ' )2


Si trabajamos con toda la población:

En la población: σ ε =
∑ (Y − Y ' )2 ; Su estimador insesgado es Sε =
) ∑ (Y − Y ' )2 (raíz de la media
n n−2
cuadrática del error)
U,ED Tudela

8.3.3.- Inferencias sobre los coeficientes de correlación y regresión.


Vertiente descriptiva vs. vertiente inferencial.
Objetivo: realizar inferencia sobre los parámetros poblacionales a partir de una muestra.
Supuestos del modelo:
1.- Independencia de las observaciones.
2.- Normalidad de las distribuciones condicionadas a cada valor de X.
3.- Homocedasticidad de las distribuciones condicionadas a cada valor de X.
4.- Independencia entre Y' y los errores en la población.
Como Sy2 = SY'2 + Sε2 , se cumple que SCY = SCY’ + SCε (ó, equivalentemente SCTOT = SCREG + SCRES)
Las sumas cuadráticas tienen asociados n-1, 1 y n-2 grados de libertad, respectivamente

8.3.3.1.- Contraste sobre el coeficiente de correlación.


H0: ρ = 0
H1: ρ ≠ 0
r n−2
Estadístico de contraste: T = XY que sigue una tn-2 (contraste bilateral)
1 − rXY
2

Ejemplo.
En un colegio se estudia la relación que puede existir entre la nota final de curso y la obtenida en el curso
anterior. Seleccionada una muestra de 11 alumnos y obtenidas ambas notas, se obtiene un coeficiente de
correlación de 0,32 (n.s. 0,05)

8.3.3.2..- Contraste para el coeficiente de regresión (Primer método: A,OVA)

Recordar que SCTOT = SCREG + SCRES y llevan asociados n-1, 1 y n-2 grados de libertad, respectivamente

H0: β = 0
H1: β ≠ 0
2
r
MC REG 1
Estadístico de contraste: F= MC = 1− r 2 (unilateral)
RES
n− 2
Ejemplo anterior

Observar que F=T2

8.3.3.3..- Contraste para el coeficiente de regresión (2º método)


H0: β = 0
H1: β ≠ 0
B−0 B−0
Estadístico de contraste: T = = sigue una tn-2 (su valor coincide con el del punto 8.3.3.1)
σβ SY 1 − rXY
2

SX n−2
8.3.3.4. Contraste para B0
H0: β 0 = 0
B0 − 0 B0 − 0
H1: β 0 ≠ 0 Estadístico de contraste: T = = , sigue una tn-2 (C. bilateral)
σB ) 1 X2
0
Sε +
n (n − 1) S X2
)
) )
donde Sε y S X son la raíz de la media cuadrática error y la cuasi-desviación típica de X, respectivamente.
UED Tudela Introducción al Análisis de Datos
8.4.- Análisis de regresión múltiple.

8.4.1.- Regresión con dos Variables Independientes


Ejemplo previo.
Plano de regresión: Y = B0 + B1X1 + B2X2
Coeficientes de regresión parcial: B1 y B2
Residuos: ε = Y - Y'

Plano de regresión en puntuaciones diferenciales: y = B1x1 + B2x2 (B1 y B2 mismos valores que en p. directas)

Plan de regresión en puntuaciones típicas: y = β 1x1 + β 2x2

Los valores de β 1 , β 2 , B0 , B1 y B2 que hacen SCε mínimo son:

8.4.2.- Ajuste del modelo. Medidas de asociación.


Coeficiente de correlación múltiple:

Y = Y' + ε
SY2'
Se demuestra que S2Y = S2Y' 2
+S ε y que RY2·12 = 2
SY

Cuanto más próximo esté a 1, más fuerte es la correlación entre Y y las otras dos variables independientes.
El estimador insesgado del coeficiente de correlación múltiple en la población ( ρY-122 ) es:

(Coeficiente de determinación múltiple muestral ajustado)

Error típico de estimación: (en la población) = desviación típica de los errores =. σ ε =


∑ (Y − Y ' ) 2


Su estimador insesgado es: Sε =


) ∑ (Y − Y ' ) 2 (p = número de variables independientes)
n − p −1

8.4.3.- Correlación Semiparcial y Parcial

También podría gustarte