T8 Asociación
T8 Asociación
T8 Asociación
TABLAS 2×2
Tablas de contingencia
Tabla de contingencia estres * CHD
Recuento
CHD
SI CHD NO CHD Total
estres SI ESTRES 97 307 404
NO ESTRES 200 1409 1609
Total 297 1716 2013
Frecuencias absolutas
3
Tablas de frecuencias relativas
Tabla de contingencia estres * CHD
CHD
SI CHD NO CHD Total
estres SI ESTRES Recuento 97 307 404
% del total 4,8% 15,3% 20,1%
NO ESTRES Recuento 200 1409 1609
% del total 9,9% 70,0% 79,9%
Total Recuento 297 1716 2013
% del total 14,8% 85,2% 100,0%
CHD CHD
SI CHD NO CHD Total SI CHD NO CHD Total
estres SI ESTRES Recuento 97 307 404 estres SI ESTRES Recuent o 97 307 404
% de estres 24,0% 76,0% 100,0% % de CHD 32,7% 17,9% 20,1%
NO ESTRES Recuento 200 1409 1609 NO ESTRES Recuent o 200 1409 1609
% de estres 12,4% 87,6% 100,0% % de CHD 67,3% 82,1% 79,9%
Total Recuento 297 1716 2013 Total Recuent o 297 1716 2013
% de estres 14,8% 85,2% 100,0% % de CHD 100,0% 100,0% 100,0%
4
Asociación entre variables cualitativas
TABLAS 2×2
Frecuencias observadas:
Frecuencias esperadas:
Grupos de Edad
Tabaco 15-16 17-18 Total
NO e11 e12 n1+
SI e21 e22 n2+
Grupos de
Total n+1 n+2 n++ Edad
Tabaco 15-16 17-18
NO 2,78 2,22
SI 2,22 1,78
Tema 9: Estudios de asociación 9
Test Chi-cuadrado de No asociación
frecuencias observadas
Casos Controles
H. Alergia 44 15 59
No H. Alergia 6 35 41
50 50 100
frecuencias “esperadas”
Casos Controles
H. Alergia 29.5 29.5
No H. Alergia 20.5 20.5
Conclusión: se rechaza .
𝒓 𝒄
(𝒏𝒊𝒋 −𝒆 𝒊𝒋 )𝟐 … …
si el valor de ∑ ∑ 𝒆
Se rechaza
𝑻 = es “grande”. … …
𝒊 =𝟏 𝒋 =𝟏 𝒊𝒋
𝒓 𝒄
(𝒏𝒊𝒋 −𝒆 𝒊𝒋 )𝟐
𝑻 =∑ ∑ El valor observado de es = 43.68
𝒊 =𝟏 𝒋 =𝟏 𝒆 𝒊𝒋
Se rechaza la no asociación
Pruebas de chi-cuadrado
Valor gl Sig. Sig. exacta Sig. exacta
asintótica (bilateral) (unilateral)
(bilateral)
Chi-cuadrado de Pearson 2.860a 1 .091
Corrección por continuidad b
2.554 1 .110
Razón de verosimilitudes 2.873 1 .090
Estadístico exacto de Fisher .094 .055
Asociación lineal por lineal 2.855 1 .091
N de casos válidos 546
a. 0 casillas (0.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima
esperada es 77.08.
b. Calculado sólo para una tabla de 2x2.
Tema 9: Estudios de asociación 13
Tabla de contingencia Medio (localidad) * Índice de masa corporal (categorías)
Índice de masa corporal (categorías) Total
Bajo Peso Obesidad
peso adecuado Sobrepeso
Recuento 2 85 12 6 105
Rural % dentro de
1.9% 81.0% 11.4% 5.7% 100.0%
Medio (localidad)
Medio (localidad)
Recuento 9 338 50 3 400
Urbano % dentro de
2.2% 84.5% 12.5% 0.8% 100.0%
Medio (localidad)
Recuento 11 423 62 9 505
Total % dentro de
2.2% 83.8% 12.3% 1.8% 100.0%
Medio (localidad)
Pruebas de chi-cuadrado
Valor gl Sig.
asintótica
(bilateral)
Chi-cuadrado de
11.749a 3 .008
Pearson
Razón de
9.041 3 .029
verosimilitudes
Asociación lineal por
3.565 1 .059
lineal
N de casos válidos 505
a. 2 casillas (25.0%) tienen una frecuencia esperada
inferior a 5. La frecuencia mínima esperada es 1.87.
• Es adimensional
Coeficiente de correlación de Pearson:
Se utiliza cuando ambas variables son cuantitativas
siguiendo una distribución normal.
Sxy
r=
Sx Sy
Sx y Sy Desviación típica
18
Correlaciones positivas:
330 130
120
280 110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
19
Correlaciones negativas:
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
20
Contraste de hipótesis:
H 0 : ρ= 0
H 1 : ρ≠ 0
Correlaciones:
Correlaciones
22
Regresión lineal
Un ejemplo: ¿Es posible “explicar”, “predecir”, “estudiar” cómo se comporta el
valor de la hemoglobina a partir del conocimiento de la edad, en las mujeres de
una cierta población?
Se dispone de los valores de ambas variables en 20 mujeres:
edad HB edad HB
16
20 11.1 45 15.1
22 10.7 49 13.9
25 12.4 54 16.2
hemoglobina
28 14.0 55 16.3
14
28 13.1 57 16.8
31 10.5 60 17.1
32 9.6 62 16.6
12
35 12.5 63 16.9
38 13.5 65 15.7
40 13.9 67 16.57
10
20 30 40 50 60
edad
Tema 9: Estudios de asociación 23
Regresión:
• El análisis de regresión sirve para predecir una
medida en función de otra medida (o varias).
– Y = Variable dependiente
• predicha
• explicada
– X = Variable independiente
• predictora
• explicativa
– ¿Es posible descubrir una relación?
• Y = f(X) + error
– f es una función de un tipo determinado
– el error es aleatorio, pequeño, y no depende de X
24
Modelo de regresión lineal simple:
En el modelo de regresión lineal simple:
Y (dependiente)
X (independiente, explicativa, predictora)
26
Representación de los Residuos:
y=ˆ
α
+βˆ
x+e
i i i Residuo
27
Residuos del modelo de regresión
28
• En el diagrama de dispersión se aprecie una clara relación lineal directa.
Correlaciones
Coeficientesa
Coeficientes no
B
a
s
e
m
áx
i
m
aˆ
A
ˆl
t
u
ra
má
x
i
m
a estandarizados
Modelo B Error típ.
̂ 7, 276 1 (Constante) 7,276 ,452
ˆ 0 ,7 73
Altura máxima ECO
a. Variable dependiente: Base máxima ECO
,773 ,059
29
Regresión lineal
Cuando un ajuste es bueno, R2 será cercano a uno. Cuando un ajuste es malo R2 será
cercano a cero.
16
𝟏𝟑
𝟎 + 𝟎.
𝟐𝟒
𝟖.
hemoglobina
Se estima que el nivel medio de 𝒚=
14
hemoglobina aumenta 1.34
unidades al aumentar la edad de
las mujeres en 10 años.
12
La correlación lineal entre la
edad y el nivel de hemoglobina
se estima en 0.880.
10
20 30 40 50 60
edad
Correlaciones
Coeficientesa
Coeficientes no
B
a
s
e
m
áx
i
m
aˆ
A
ˆl
t
u
ra
má
x
i
m
a estandarizados
Modelo B Error típ.
̂ 7, 276 1 (Constante) 7,276 ,452
ˆ 0 ,7 73
Altura máxima ECO
a. Variable dependiente: Base máxima ECO
,773 ,059
35
• Salario / Educación-experiencia-sexo
• Cosecha / Abono-lluvias-temperaturas
y
=
α
+
β
1
x
+
1β
x
2
2+
β
x
3
3+
β
x
4
4+
β
x
5
5+
+
β
x
+
k
ke
Componente Aleatorio
modelo
Parámetros del
modelo
Constante del
Variable Dependiente
explicativas
Variables
Componentes de la ecuación:
• Variable Dependiente: variable de interés en el estudio,
aquella que queremos relacionar
• Variables explicativas: Variables que desde el punto de
vista del investigador están relacionadas con la principal
del estudio
• Constante del modelo (, intercept): valor (numérico)
que tomaría la variable dependiente cuando el resto de
variables tomen valor 0 (Valor Desconocido)
Componentes de la ecuación:
• Parámetros (1, 2,…, k): indica el peso relativo de esa
variable en la ecuación, representa el incremento por
término medio en la variable respuesta por cada unidad
adicional en la variable explicativa (Valores Desconocidos)
R2 B SE p
Constant 10.506 1.945 0.000
Mental health factors
Mental health (SF-36 MCS score) -0.143 0.014 0.000
Anxiety (STAI-6 score) 0.125 5.427 1.285 0.000
Physical health factors
Physical health (SF-36 PCS score) -0.059 0.012 0.000
Physical activity (HAP score) 0.341 -0.021 0.009 0.018
Visual function (VF-14 score) 0.400 -0.220 0.064 0.001
Lives with others versus lives alone -0.159 0.216 0.446
Lives in retirement versus lives alone -0.551 0.472 0.047
Overall R2 0.421