S14.s1 - Teoría y Práctica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

20 INFERENCIA ACERCA DEL COEFICIEN-

TE DE REGRESIÓN β

LOGRO DE LA SESIÓN

Al finalizar la sesión de aprendizaje el estudiante estima y realiza pruebas de hipótesis para el coeficiente
de regresión poblacional.

20.1 Modelo de regresión poblacional

Consideremos la variable aleatoria Y dependiente de una sola variable independiente X . La relación lineal que
suponemos que existe entre X y Y es la especificada por el modelo estadístico (modelo probabilístico):

Y = α + βX + ²

Donde:
X : Variable independiente.
Y : Variable dependiente.
α : Es la ordenada en el origen o término constante.
β : Es la pendiente de la regresión.
² : Es el error o residuo del modelo.

Los supuestos que se hacen sobre la variable aleatoria error ² del modelo de regresión general son los supuestos
del modelo de regresión lineal simple. Estos supuestos son:

1. Normalidad: Se supone que cada variable Yi tiene una distribución normal.

2. Independencia: Se supone que las Yi son variables aleatorias estadísticamente independientes.

3. Linealidad: Se supone que la relación de Y con X es lineal.

4. Igualdad de varianzas (Homoscedasticidad): Se supone que las varianzas de Yi en cada X i son iguales a la
varianza común σ2 , denominada varianza de la regresión.

La estimación del modelo de regresión poblacional es la ecuación de la regresión muestral Y = a + bX . Donde a y


b son las estimaciones de los parámetros α, β.

UTP Sede Arequipa 1 Guia 20


INFERENCIA ACERCA DEL COEFICIENTE DE REGRESIÓN β

20.2 Estimación de la varianza de la regresión poblacional

La varianza de la regresión poblacional, denotada por σ2 se define por:


N
(y i − µY )2
X
i =1
σ2 =
N
Este número mide el grado o nivel de variabilidad de los datos en torno a la línea de regresión.
La estimación de la varianza σ2 es la varianza de la regresión muestral denotada por s 2 y está dada por:
n n n
y i2 − a
X X X
yi − b xi y i
2 SC E i =1 i =1 i =1
s = =
n −2 n −2
La desviación estándar s de la regresión muestral o error estándar de estimación, está dado por la raíz cuadrada
de la varianza de la regresión muestral: s
p SC E
s = s2 =
n −2
Mide de manera descriptiva el ajuste del modelo de regresión estimado a los datos de la muestra, cuanto más
pequeño sea el valor de s, mejor será el ajuste del modelo de regresión estimado a los datos de la muestra. Este
error tiene las mismas unidades de Y .

20.2.1. Distribución muestral de b

La estadística b del modelo de regresión muestral, tiene un distribución t -Student con n − 2 grados de libertad,
esto es:
b −β
∼ t (n−2)
σbb
s
Donde, σ bb = s
n
x i2 − nx 2
X
i =1

20.2.2. Intervalo de confianza de β

El intervalo de estimación de β con un nivel de confianza de 1 − α es dado por:


h i
IC (β, 1 − α) = b − t (1− α ,n−2) σ
b b ; b + t (1− α ,n−2) σ
2
bb
2

s
Donde, σ
bb = s
n
x i2 − nx 2
X
i =1

20.2.3. Prueba de hipótesis para β

1. Hipótesis: Plantear adecuadamente la hipótesis H0 contra la hipótesis alternativa H1 .

a) H0 : β = β0 vs H1 : β 6= β0
b) H0 : β ≥ β0 vs H1 : β < β0
c) H0 : β ≤ β0 vs H1 : β > β0

2. Nivel de significación: Seleccionar un nivel de significación α.

UTP Sede Arequipa 2 Guia 20


E STADÍSTICA I NFERENCIAL

3. Estadística de prueba:
b − β0
tc = ∼ t (n−2)
σ
bb
s
Donde, σ
bb = s
n
x i2 − nx 2
X
i =1

4. Región crítica: La región critica es fijada de acuerdo a la hipótesis H1 , al nivel de significación α y a la


distribución muestral de la estadística (t c ). Como se muestran en las siguientes gráficas.

5. Cálculo de la estadística de prueba: Calcular el valor de t c .

6. Conclusión: Tomar la decisión de aceptar o rechazar H0 .

Ejemplo 20.1

Jensen Tire & Auto está por decidir si firma un contrato de mantenimiento para su nueva máquina de
alineamiento y balanceo de neumáticos. Los gerentes piensan que los gastos de mantenimiento deberán
estar relacionados con el uso y recolectan los datos siguientes sobre uso semanal (horas) y gastos anuales
de mantenimiento (en cientos de dólares).
Uso semanal (horas) 13 10 20 28 32 17 24 31 40 38
Gastos anuales en mantenimiento 17 22 30 37 47 30.5 32.5 39 51.5 40

a. Construya un intervalo de confianza para β, con un nivel de confianza del 95 %. ¿Existe relación entre
las variables?

UTP Sede Arequipa 3 Guia 20


INFERENCIA ACERCA DEL COEFICIENTE DE REGRESIÓN β

b. Realice una prueba de hipótesis sobre β, para determinar si existe relación entre las dos variables,
utilizando un nivel de significación de 5 %.

UTP Sede Arequipa 4 Guia 20


E STADÍSTICA I NFERENCIAL

EJERCICIOS ADICIONALES

1. Un profesor de estadística se interesa en la relación entre las horas de estudio y los puntos obtenidos en el
curso. A continuación vemos los datos reunidos de 9 alumnos que acaban de tomar el curso.

Horas de estudio 45 30 90 60 105 65 90 80 55


Total de puntos obtenidos 40 35 75 65 90 50 90 80 45
Haga una estimación por intervalo para β, con un nivel de confianza del 99 %. ¿Existe relación entre las
variables?

2. Se supone que el alargamiento de un cable de acero está relacionado linealmente con la intensi-
dad de la fuerza aplicada. Cinco especímenes idénticos de cable dieron los resultados siguientes:
Fuerza (X) 1 1.5 2 2.5 3
Con un nivel de significación del 5 % probar si existe una
Alargamiento (Y) 3 3.5 5.4 6.9 8.4
relación lineal positiva entre la fuerza aplicada y el alargamiento.

3. El banco “PRESTAMO” estudia la relación entre las variables ingresos y ahorros mensuales
de sus clientes. Una muestra aleatoria de sus clientes reveló los siguientes datos en dólares:
Ingresos 350 400 450 500 950 850 700 900 600
Ahorros 100 110 130 160 350 350 250 320 130

a) Ajuste a los datos un modelo de regresión lineal simple y comente la pendiente.


b) Estime el monto del ahorro para un ingreso de $1200.
c) Determine el intervalo de confianza del 95 % para β, ¿se puede afirmar que existe relación entre las
variables?

4. Una compañía de alimentos maneja una cadena de tiendas al menudeo. Para medir la eficiencia de las
tiendas se estudió la relación del número de empleados (X ) y el promedio del volumen de ventas mensuales
(Y ) expresadas en cientos de dólares para todas las tiendas durante el año pasado. La gráfica de los datos
sugiere una relación lineal entre las variables. Adicionalmente se tiene la siguiente información:
n n n n n
x i2 = 5200, y i2 = 37700
X X X X X
n = 100, x i = 600, y i = 1600, x i y i = 13600,
i =1 i =1 i =1 i =1 i =1

Utilizando una prueba de hipótesis para β verificar si existe relación las variables.

UTP Sede Arequipa 5 Guia 20

También podría gustarte