0% acharam este documento útil (0 voto)
1 visualizações25 páginas

Aula 14 - Correlação e Regressão Linear (1)

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1/ 25

Correlação

e
Regressão Linear

• Prof.: Joni Fusinato


• joni.fusinato@ifsc.edu.br
• Nos estudos científicos procura-se verificar se
existe relação entre duas ou mais variáveis,
isto é, saber se as alterações sofridas por uma
das variáveis são acompanhadas por
alterações nas outras.

• O termo correlação é usado em estatística


Introdução para designar a força que mantém unidos dois
conjuntos de valores e do grau de relação
entre as variáveis.

• Uma vez caracterizada esta relação, procura-se


descrevê-la sob forma matemática, através de
uma função.

• A estimação dos parâmetros dessa função


matemática é o objeto da regressão.
Diagrama de Dispersão

• É uma representação gráfica da possível


relação entre duas variáveis mostrando
graficamente os pares de dados
numéricos e sua relação.
• Geralmente, a relação vem de uma
variável que é independente e outra
variável que é dependente da primeira,
ou seja, a variável independente é a
causa que provoca o efeito e a
dependente é o efeito (a consequência
gerada pela causa).
Correlação e Regressão

• Diagrama de Dispersão:
representação gráfica da relação
entre as variáveis.

• Correlação (r): teste estatístico


que mede o grau de relação
entre duas variáveis.

• Regressão: fornece uma função


matemática que relaciona as
variáveis.
É um teste cujo objetivo é medir o grau de
correlação linear entre duas variáveis
quantitativas.
Correlação Linear
de Pearson O coeficiente de correlação de Pearson é um
número adimensional onde
É sensível a valores extremos de dados. Um
valor único que seja muito diferente dos
outros valores de um conjunto pode mudar
Coeficiente de consideravelmente o valor do coeficiente.
Person (r)
E o que fazer se isso ocorrer? Identifique a
causa do valor extremo e faça a correção dos
erros de entrada de dados ou de medidas. Ou
ainda, retire os valores de dados associados a
eventos atípicos.
Coeficiente de correlação
linear de Pearson (r)
Coeficiente de correlação linear de Pearson (r)
• O coeficiente é uma medida que avalia o quanto a “nuvem de pontos”
no diagrama de dispersão aproxima-se de uma reta.
• O valor de r mostra se é adequado ou não usar o modelo linear para
modelar um fenômeno.

r > 0: correlação diretamente proporcional

r < 0: correlação inversamente proporcional


• Arredondar r com
3 casas decimais. r = 0: correlação nula
Interpretação do Coeficiente de correlação linear (r)

r Correlação
0,000 Nula
0,000 ├ 0,350 Fraca
0,350 ├ 0,650 Média
0,650 ├ 0,950 Forte
0,950 ├ 0,990 Muito forte
1,000 Perfeita
Correlação e Causalidade

O fato de duas variáveis serem


fortemente correlacionadas não
implica uma relação de causa e
efeito entre elas. Um estudo mais
elaborado pode ser necessário
para determinar se há uma
relação causal entre as variáveis.
As seguintes questões devem ser
consideradas ao pesquisador:
- Há uma relação direta de causa
e efeito entre as variáveis?
- É possível que a relação entre
duas variáveis seja uma
coincidência?
Linha de Regressão e Equação de Regressão linear
Variável Dependente (Y)

m: coeficiente angular
(inclinação)
b: coeficiente linear

Variável Independente (X)


Regressão Linear Simples
• A regressão linear simples é um modelo matemático cujo objetivo é
indicar qual será o comportamento de uma variável dependente (Y)
como uma função que contenha uma variável independente (X).

Determina a equação da reta


ajustada (método dos mínimos
quadrados).

Equação da reta
y = mx + b ou y = ax + b

As calculadoras geralmente
apresentam a equação da reta
na forma y = Bx + A.
Equação de Regressão

a: ordenada na origem (coeficiente linear da reta).


b: inclinação da reta (coeficiente angular).
• O valor R é o coeficiente
de correlação. É uma
medida da qualidade da
previsão da variável
dependente pois ele mede a
direção e a força de uma
relação linear.

• O valor R2 é o coeficiente de
determinação. Seu valor nos
informa que percentual é
eliminado do erro de
previsão na variável y
quando usamos a regressão
de mínimos quadrados
sobre a variável x. O
valor R2 = 0,9998 mostra que
as variáveis independentes
explicam 99,98% da variação
da variável dependente.
Uso da Calculadora para Regressão Linear

https://www.youtube.com/watch?v=LkkRRWtUQn0

X Y

0,7 2,1
0,9 2,4
1,1 2,6
1,28 2,84

Y = Bx + A
Y = 1,247x + 1,244

R = 0,997
Exemplo 1: O diagrama relaciona o tempo de estudo com o desempenho
acadêmico.
a) Mostre se há relação entre o desempenho acadêmico e o tempo
dedicado aos estudos.
b) Caso houver a relação entre o desempenho e o tempo de estudo,
apresente a função que relaciona as variáveis.

X : Tempo de estudo (em horas)


Diagrama de Dispersão
Y : Desempenho Acadêmico
9,5

Tempo (X) Desempenho 8,5

(Y) 7,5

Nota
3,0 4,5
6,5

5,5

7,0 6,5 4,5

2,0 3,7 3,5


0 5 10

1,5 4,0 Tempo

12,0 9,3
Exemplo 1: O diagrama relaciona o tempo de estudo com o desempenho
acadêmico.
a) Mostre se há relação entre o desempenho acadêmico e o tempo
dedicado aos estudos.
b) Caso houver a relação entre o desempenho e o tempo de estudo,
apresente a função que relaciona as variáveis.

X : Tempo de estudo (em horas)


Diagrama de Dispersão
Y : Desempenho Acadêmico
9,5

Tempo (X) Desempenho 8,5

(Y) 7,5

Nota
3,0 4,5
6,5

5,5

7,0 6,5 4,5

2,0 3,7 3,5


0 5 10

1,5 4,0 Tempo

12,0 9,3
a) Para mostrar a relação entre as variáveis calculamos o valor de r.

• Usando a calculadora (Casio FX-82MS) digite Mode REG 3 e


escolha 1 (LIN de Linear).
• Digite os valores dos pares (x, y) nesta ordem e aperte M+
• Depois de inserir a sequência de pares ordenados digite Shift 2
deslocando o cursor até encontrar r e aperte a tecla 3 =
• Como r = 0,996 podemos afirmar que há uma forte correlação
entre as variáveis.

b) Para encontrar a função que relaciona as variáveis usando a


calculadora por padrão ela apresenta a equação da reta na forma
y = Bx + A, portanto B = coeficiente angular e A = coeficiente
linear.

Equação da reta: y = 0,527x + 2,913


Exemplo 2: Relação entre consumo de cerveja e temperatura

• As variáveis foram observadas em Local Temperatura Consumo


localidades com características (oC) Litros
demográficas e socioeconômicas
semelhantes.
1 16 290
a) Calcule e interprete a correlação 2 31 374
entre as variáveis. 3 38 393
b) Determine a função que relaciona 4 39 424
as variáveis. 5 37 406
c) Calcule o consumo esperado para 6 36 370
uma temperatura de 25 oC. 7 36 365
8 22 320
9 10 269
Exemplo 2: Relação entre consumo de cerveja e temperatura

Diagrama de dispersão

a) r = 0,962. A correlação
entre as variáveis é forte.
b) y = 4,739x + 217,366
c) y = 4,739.25 + 217,366
y = 335,841 litros
• A partir dos dados apresente a
correlação e a função matemática que
Atividade relaciona a diferença de potencial (ddp) e
a corrente elétrica (i) para um resistor
ôhmico.

DDP (V) i (mA)

1,23 1,1
2,20 1,9
3,15 3,2
4,05 4,1
5,10 4,9
5,98 6,0
7,01 7,1
8,12 8,2
DDP X I(mA)
10

6
DDP (V)

4
y = 1,0373x - 0,2141
2 R² = 0,9977

0
0 2 4 6 8 10
I (mA)
Atividade
A partir dos dados apresente a correlação e a função matemática
que relaciona as variáveis.

r = 0,802
y = 0,0056x + 1,350
A partir dos dados apresente a correlação e a função matemática
que relaciona as variáveis.

r = 0,975
y = 2,073x + 1,455
https://www.youtube.com/watch?v=uF78_zMorHU - Correlação e Regressão
Linear; aula teórica com exemplo resolvido sem uso de calculadora.

https://www.youtube.com/watch?v=5Nmzd9slQk0 - Correlação e Regressão Linear


usando a calculadora Casio FX 82 MS

https://www.youtube.com/watch?v=Dwc78UmCs_Y – Regressão Linear com a


Casio FX 82 MS.

https://www.youtube.com/watch?v=rTcp161k8q4 – Diagrama de Dispersão: Teoria


+ Exemplo no Excel.

https://www.youtube.com/watch?v=LjGVg6B3YhY - Excel - Correlação e Regressão


Linear.

Você também pode gostar