Coeficiente de Determinación
Coeficiente de Determinación
Coeficiente de Determinación
En la expresión anterior tenemos una fracción. Así pues, vayamos por partes. En primer
lugar, analizaremos el numerador, es decir, la parte de arriba.
Para aquellos que no conozcan la expresión de la varianza, les recomiendo que lean el
artículo sobre la misma. Para aquellos que sí la conozcan, podrán caer en la cuenta de que
es la expresión de la varianza, pero con dos diferencias fundamentales.
En segundo lugar, faltaría dividir entre T. Que, en otros casos, se nota como N o número de
observaciones. Sin embargo, dado que la fórmula del denominador también la llevaría,
eliminamos los denominadores (parte de abajo) de ambas fórmulas para simplificar la
expresión. De esta manera es más fácil trabajar con ella.
A continuación, vamos a realizar el mismo análisis con la parte del denominador (parte de
abajo).
Supongamos que queremos explicar la cantidad de goles que anota Cristiano Ronaldo
según la cantidad de partidos que juega. Suponemos que, a mayor cantidad de partidos
jugados, más goles meterá. Los datos pertenecen a las últimas 8 temporadas. De tal manera,
tras extraer los datos, el modelo arroja la siguiente estimación:
Cómo podemos ver en el gráfico, la relación es positiva. A más partidos jugados, como es
lógico, más goles anota en la temporada. El ajuste, según el cálculo del R cuadrado, es de
0,835. Esto quiere decir que es un modelo cuyas estimaciones se ajustan bastante bien a la
variable real. Aunque técnicamente no sería correcto, podríamos decir algo así como que el
modelo explica en un 83,5% a la variable real.
Recordando que k es el número de variables explicativas, deducimos que este no puede ser
cero. Si fuese cero, no existiría modelo. Como mínimo tendremos que explicar una variable
en función de otra variable. Dado que k debe ser como mínimo 1, el R cuadrado ajustado y
el R cuadrado normal no pueden tener el mismo valor. Es más, el R cuadrado ajustado será
siempre inferior al R cuadrado normal.