Taller 3 Solucion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Estadística II - Taller 03 Semestre: 2021-02

Profesores: Carlos M. Lopera-Gómez y Raúl Alberto Pérez


Monitor: Simon Pedro Galeano

Este taller se divide en dos secciones, en la primera se trabajará lo relacionado a la validación


del modelo. Posterior a esto, se considera un ejercicio en el que se realiza la prueba de falta
de ajuste a un modelo.
En primer lugar considere el siguiente conjunto de datos.

Cuadro 1: Presentación de los datos

y x
36.460743 5.878002
6.075999 -0.624800
47.402151 -3.727324
62.778036 -4.232765
28.971238 -2.318757
6.675766 3.712115

El día de hoy, la misión será realizar los siguientes ejercicios, claro está, haciendo uso de R.
1. Genere la base de datos que se muestra previamente usando el siguiente código.
gen_dat <- function(n, seed = 7) {
varianza <- 16
set.seed(seed)
x <- runif(n=n, min=-5, max=6)
media <- 4 - 6 * x + 2 * xˆ2
set.seed(seedˆ2)
y <- rnorm(n=n, mean=media, sd=sqrt(varianza))
marco_datos <- data.frame(y=y, x=x)
return(marco_datos)
}

datos <- gen_dat(75)

2. Ajuste el modelo de regresión lineal simple


iid
yi = β0 + β1 xi + εi , εi ∼ N (0, σ 2 ); 1 ≤ i ≤ 75

3. Determine que parámetros son significativos y cuales no en el modelo, hágalo de manera


rápida aprovechando alguna de las funciones de R usadas hasta el momento.

1
4. Extraiga los residuales del modelo y verifique que estos tengan media igual a 0, dé un
argumento de por qué este supuesto siempre se cumple.
5. Determine si los residuales tienen varianza constante, argumente por qué esto es o no
es así, además, si nota algún patrón o algo que considere anormal, coméntelo.
6. Evalúe el supuesto de normalidad de los residuales, hágalo usando un histograma, un
gráfico cuantil - cuantil y finalmente una prueba de hipótesis.
7. Finalmente verifique si los residuales son o no independientes, hágalo de manera gráfica.
Los valores de las variables están ingresados en la base de datos por orden cronológico.
8. Con la base de datos table.b3 del paquete MPV, realice la prueba de falta de ajuste, del
modelo
iid
yi = β0 + β1 x4i + εi , εi ∼ N (0, σ 2 ); 1 ≤ i ≤ 32
para ello use la función rsm del paquete rsm.
Nota: se propone como ejercicio realizar la validación del modelo.

2
Solución

Ejercicio 1
Corriendo el código que se deja en el enunciado es lo único que se debe hacer para la realización
de este ejercicio.

Ejercicio 2
Recuerde usar la función lm para el ajuste del modelo.

Ejercicio 3
La respuesta a este ejercicio es que ambos parámetros (β0 y β1 ) son significativos, esto se
puede verificar rápidamente con la función summary.

Ejercicio 4
Los residuales se pueden extraer de varias maneras, sin embargo se sugiere el uso de la función
residuals.
Se da un argumento de por qué la media de los residuales siempre es cero.
Pn
Recuerde S(β0 , β1 ) = i=1 (yi − β0 − β1 xi )2 .
Derivando parcialmente respecto a β0 se sigue que.

n
(yi − β0 − β1 xi )2
X
∂β0 S(β0 , β1 ) = ∂β0
i=1
n
∂β0 (yi − β0 − β1 xi )2
X
=
i=1
n
X
= −2 (yi − β0 − β1 xi )
i=1

Luego, igualando a cero la anterior expresión se tiene que

3
n
X
0 = −2 (yi − β0 − β1 xi )
i=1
n
X
= (yi − β0 − β1 xi )
i=1
| {z }
ei
n
X
= ei
i=1
n
X ei
= ¡Esta es la media de los residuales!
i=1 n

Dado que para la estimación de los parámetros se requiere que la suma de los residuales sea
nula, se tiene de inmediato que su promedio también será nulo.

Ejercicio 5
Ajustados vs residuales
50

25
Residuales

−25

10 20 30
Valores ajustados

Figura 1: Verificación del supuesto de homocedasticidad

Como se puede ver en la figura anterior, se viola notoriamente el supuesto de varianza


constante, además, se tiene una posible no linealidad debido a la forma en “U” de los

4
residuales cuando son graficados contra los valores ajustados.

Ejercicio 6
Histograma para los residuales
20
Frecuencia

15

10

0
−20 0 20 40
Residuales

Gráfico cuantil − cuantil


Cuantiles muestrales

30

−30

−60
−2 −1 0 1 2
Cuantiles teóricos

Figura 2: Verificación del supuesto de normalidad

Tanto del histograma como del gráfico cuantil - cuantil se puede empieza a sospechar de la
normalidad de los residuales, además, al realizar la prueba de Shapiro-Wilk se obtiene un
valor p de 0, (en realidad es del orden de 10−5 ) lo cual implica que los residuales no provienen
de una población normal.

5
Ejercicio 7
Residuales vs tiempo

25
Residuales

−25

0 20 40 60
Orden de recolección

Figura 3: Verificación del supuesto de independencia

En el gráfico anterior no se nota patron alguno, de hecho se nota la “nube de moscas”, por
tanto (al menos desde lo que permite ver la gráfico) se cumple el supuesto en cuestión.

6
Ejercicio 8
Este fue el resultado obtenido luego de ajustar el modelo y realizar la prueba de ajuste.

Cuadro 2: Resumen prueba falta de ajuste

g.l. Suma de cuadrados Cuadrado medio F0 Valor p


x4 1 157.3249 157.3249 4.3693 0.0452
Residuales 30 1080.2192 36.0073
Falta de ajuste 5 141.5328 28.3066 0.7539 0.5912
Error puro 25 938.6864 37.5475

También podría gustarte