5 Estadistica (ErEstim AnCorrelac)
5 Estadistica (ErEstim AnCorrelac)
5 Estadistica (ErEstim AnCorrelac)
Donde:
Y = Valores de la variable dependiente.
a = Ordenada Y (ordenada en el origen).
b = Pendiente de la línea de estimación de mejor ajuste.
X = Valores de la variable independiente.
n = Número de puntos.
Substituyendo los datos del ejemplo del Departamento de salubridad que busca la relación
entre la antigüedad de un camión de basura y los gastos anuales de reparación que debe
esperar, se tiene:
∑(Y-Ŷ )2 [22]
La segunda variación, la de los valores de Y alrededor de
su propia media, está determinada por:
∑(Y-Ȳ )2 [23]
𝑎 ∑ 𝑌 + 𝑏 ∑ 𝑋𝑌 − 𝑛𝑌̅ 2 [25]
𝑟2 =
∑ 𝑌 2 − 𝑛𝑌̅ 2
Donde:
r2 = Coeficiente de determinación de la muestra
Ȳ = Media de los valores observados de la variable dependiente.
Y = Valores de la variable dependiente.
a = Ordenada Y (ordenada en el origen).
b = Pendiente de la línea de estimación de mejor ajuste.
X = Valores de la variable independiente.
n = Número de puntos.
Ejemplo
Para ver por qué esta fórmula constituye un método abreviado, la aplicaremos a la regresión
que relaciona el caso de los gastos de investigación y desarrollo con las ganancias. Considere
que deberá agregar una columna, Y2. Recuerde que cuando encontramos los valores para a y
b, la recta de regresión para este problema era: Ŷ = 20 + 2X
Así, podemos concluir que la variación en los gastos de investigación y desarrollo (la variable
independiente X) explica el 82.6% de la variación en las ganancias anuales (la variable
dependiente Y).
Coeficiente de El coeficiente de correlación es la segunda medida que
correlación podemos usar para describir qué tan bien explica una
variable a otra. Cuando tratamos con muestras, el
coeficiente de correlación de la muestra se denota por r, y
es la raíz cuadrada del coeficiente de determinación de
muestra:
𝑟 = √𝑟 2 [26]
Por lo que, por ejemplo, para el problema que relaciona los gastos de investigación
y desarrollo con las ganancias anuales, el coeficiente de correlación r sería igual
0.909, que es la raíz cuadrada de 0.826 (coeficiente de determinación muestral del
mismo ejemplo); y por lo tanto, la relación entre las dos variables es directa y la
pendiente es positiva; por tanto, el signo de r es positivo.
Ver archivo IV Reg Simple y Correl.xlsx para comprobación de resultado.