Valores P y R

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 3

Caractersticas del coeficiente de correlacin de Pearson

Tema 7. REGRESIN Y CORRELACIN


r=1
Correlacin positiva perfecta
90 80

r=

1 n xi X yi Y s s n 1 i=1 x y
aprox. r = 0
No correlacin

r = -1
Correlacin negativa perfecta
90

90 80

80

Y 70
60 50 20 25 30 35 40

Y 70
60 50 20 25 30

Y 70
60

50

35

40

20

25

30

35

40

Coeficiente de correlacin: Precaucin Ejemplos reales


El valor de r no sustituye la informacin del diagrama bivariante
Situacin 1
95 90 85 80 75 150 160 170 180

Situacin 2
95
95 90 85 80 75

Situacin 3

90 85 80 75 150
Tem peratura

Los 7 diagramas presentan una correlacin de r = 0,7

160 170 Temperatura

180

150

160 170 Temperatura

180

r = 0,983
p-value: 0,000

r = 0,887
p-value: 0,000

r = 0,230
p-value: 0,108

Un valor de r distinto de 0 no implica relacin lineal Es necesario que sea significativamente distinto de cero
Fuente:J.M. Chambers et al. Graphical Methods for Data Analysis. Duxbury Press 1983

Coeficiente de correlacin: Tablas para valorar la significacin


Valores de r que dan niveles de significacin (p-valor) del 5 y del 1 %
Ref. Pere Grima
n 3 4 5 6 7 8 9 10 11 12 13 14 15 p-valor 0,05 0,997 0,95 0,878 0,811 0,754 0,707 0,666 0,632 0,602 0,576 0,553 0,532 0,514 0,01 1 0,99 0,959 0,917 0,875 0,834 0,798 0,765 0,735 0,708 0,684 0,661 0,641 n 16 17 18 19 20 21 22 23 24 25 26 27 28 p-valor 0,05 0,497 0,482 0,468 0,456 0,444 0,433 0,423 0,413 0,404 0,396 0,388 0,381 0,374 0,01 0,623 0,606 0,59 0,575 0,561 0,549 0,537 0,526 0,515 0,505 0,496 0,487 0,479 n 29 30 35 40 45 50 55 60 65 70 75 80 85 p-valor 0,05 0,367 0,361 0,334 0,312 0,294 0,279 0,266 0,254 0,244 0,235 0,227 0,22 0,213 0,01 0,471 0,463 0,43 0,403 0,38 0,361 0,345 0,33 0,317 0,306 0,296 0,286 0,278

Coeficiente de correlacin: Interpretacin del p-valor


Situacin 3
95 90 85 80 75 150 160 170 Temperatura 180

r = 0,230
p-value: 0,108

Pero, qu significa p-value = 0,108 ?

Es el resultado de realizar un test para comprobar la hiptesis de independencia entre las variables consideradas (solo si p<0,05 se rechaza la hiptesis, porque sera muy poco probable que dos variables independientes dieran un r con ese valor)

Coeficiente de correlacin: Interpretacin del p-value


Valores de r obtenidos al realizar 10.000 simulaciones con muestras INDEPENDIENTES El 10,8 % de los casos [(536+558) /1000] da un valor de |r| > 0,23
600 500 400 300 200 100 0 -1,0 -0,8 -0,6 -0,4 -0,2 0,0 -0,23 0,2 0,23 0,4 0,6 0,8 1,0
Valores correspondientes a las situaciones 1 y 2

Anlisis de los residuos: 3 situaciones distintas de residuos

Frequency

536 casos

558 casos

Los residuos no contienen informacin. El modelo propuesto es el adecuado e

Los residuos contienen informacin. la relacin entre X e Y parece no ser lineal e

La recta ser menos precisa para valores grandes de x, que para valores pequeos. e

y 0

Cuidado con: Observaciones raras

Cuidado con: Extrapolacin

Observacin atpica: observacin que no encaja en el aspecto general de la nube de puntos del grfico de dispersin (puede serlo por tener un valor muy distanciado del resto en la y, en la x o en ambas) Observacin influyente: aquella que si la eliminamos del estudio, produce un cambio notable en la posicin de la recta de regresin (normalmente valores grandes de x. Su residuo puede ser pequeo) y
Obs. atpica

Extrapolacin: utilizacin de la recta de regresin para predecir fuera de los valores observados

Previsin

Valor real Modelo correcto


Obs. atpica e influyente x

Cuidado con: Variables latentes y relaciones causa-efecto

La relacin entre dos variables puede estar influida por otras que no sospechamos su existencia o simplemente no las medimos. A stas se les llama variables latentes. Una fuerte asociacin entre 2 variables no es suficiente para sacar conclusiones sobre relaciones causa-efecto. La mejor manera de evidenciar de que una asociacin se debe a la causalidad, se obtiene mediante las tnicas DOE

También podría gustarte