Método Dos Mínimos Quadrados
Método Dos Mínimos Quadrados
Método Dos Mínimos Quadrados
Um requisito para o método dos mínimos quadrados é que o fator imprevisível (erro) seja
distribuído aleatoriamente e essa distribuição seja normal. O Teorema Gauss-Markov garante
(embora indiretamente) que o estimador de mínimos quadrados é o estimador não-enviesado de
mínima variância linear na variável resposta.
Outro requisito é que o modelo é linear nos parâmetros, ou seja, as variáveis apresentam uma
relação linear entre si. Caso contrário, deveria ser usado um modelo de regressão não-linear.
Credita-se Carl Friedrich Gauss como o desenvolvedor das bases fundamentais do método dos
mínimos quadrados, em 1795, quando Gauss tinha apenas dezoito anos. Entretanto, Adrien-
Marie Legendre foi o primeiro a publicar o método em 1805, em seu Nouvelles méthodes pour la
détermination des orbites des comètes. Gauss publicou suas conclusões apenas em 1809.[2][3][4]
Índice
1 Regressão simples
o 1.1 Exemplo de regressão simples
2 Regressão múltipla
o 2.1 Exemplo de regressão múltipla
3 Premissas
4 Coeficiente de determinação R²
o 4.1 Exemplo de R² e R² ajustado
5 Teste de significância dos coeficientes
o 5.1 Exemplo de teste de significância dos coeficientes
6 Referências
7 Ver também
8 Ligações externas
Regressão simples
outra variável que acreditamos ter poder de explicação sobre conforme a fórmula:
onde:
Também temos uma base de dados com valores observados de e de . Perceba que,
usando a base de dados, e são vetores, ou seja, representam uma lista de valores, um
para cada observação da base de dados. O método dos mínimos quadrados ajuda a encontrar as
Deste modo, ao estimar o modelo usando a base de dados, estamos estimando, na verdade:
onde indica cada uma das observações da base de dados e passa a ser chamado de
resíduo, ao invés de erro. Em alguns livros, a notação para as estimativas dos parâmetros é um
O método dos mínimos quadrados minimiza a soma dos quadrado dos resíduos, ou seja,
minimiza .
A ideia por trás dessa técnica é que, minimizando a soma do quadrado dos resíduos,
Alguns livros também usam uma fórmula diferente que gera o mesmo resultado:
Consumo Renda
1 122 139
2 114 126
3 86 90
4 134 144
5 146 163
6 107 136
7 68 61
8 117 62
9 71 41
10 98 120
portanto,
Interpretação: Tirando a parte do Consumo que não é influenciada pela Renda, o incremento de
$ 1 na Renda causa um incremento esperado de $ 0,4954 no Consumo.
Regressão múltipla
A regressão múltipla apresenta um funcionamento parecido com o da regressão simples, porém,
Ao usar a base de dados com variáveis explicativas e observações, o modelo pode ser
escrito na forma matricial:
quadrado dos resíduos , que pode ser reescrito como , onde o apóstrofe significa que a
matriz foi transposta.
termo não depende de , os segundo e terceiro termos são iguais e o terceiro termo é uma
portanto,
Interpretação: Tirando a parte do Consumo que não é influenciada pela Taxa de Juros, o
incremento de $ 1 na Renda causa um incremento esperado de $ 0,6136 no Consumo; além
disso, o incremento de 1 ponto percentual (0,01) na Taxa de Juros causa um decréscimo
esperado de $ 1034,41 no Consumo.
Premissas
Ao usar o método dos mínimos quadrados, assumimos algumas premissas a respeito das
variáveis:
qualquer .
linear .
Erro tem distribuição normal: O erro é distribuído conforme a curva de distribuição
normal.
Caso alguma dessas premissas não seja verdadeira, o método pode gerar resultados sub-ótimos
ou com viés.
Coeficiente de determinação R²
Ver artigo principal: R²
, sendo SQres o Somatório dos Quadrados dos Resíduos e SQtot o Somatório dos
Quadrados Total
ou R² ajustado:
Exemplo de R² e R² ajustado
Se uma variável realmente possui poder explicativo sobre , seu coeficiente deve
ser estatísticamente diferente de zero. Ou seja, deve ser suficientemente maior ou menor do que
zero para que tenhamos confiança de que a variável realmente possui poder explicativo. Caso
isso não seja verdade, a variável poderia ser retirada do modelo sem que exista grande perda da
sua qualidade. Para verificar se os coeficientes são significantes, levamos em consideração que o
nível de confiança de 95% é 2,3646. Como é maior que 2,3646, a hipótese nula de que
é rejeitada com, pelo menos 95% de confiança. O mesmo também ocorre para .