Estadística Descriptiva Bivariante
Estadística Descriptiva Bivariante
Estadística Descriptiva Bivariante
1. Datos bivariantes
Estadı́stica descriptiva bivariante
2. Representaciones gráficas
5 6
Momentos respecto al origen (c, v ) = (0, 0) de órdenes r y s: Momentos respecto al origen (c, v ) = (X , Y ) de órdenes r y s:
p
k X
X
(xi − X )r (yj − Y )s · nij
Pk Pp Pk Pp
i=1 j=1 (xi − 0)r (yj − 0)s · nij i=1
r
j=1 (xi ) (yj )
s
· nij
ar ,s = = i=1 j=1
N N mr ,s =
N
Momentos de interés
Momentos de interés
a0,0 = 1 p
k X
X
(xi − X )(yj − Y ) · nij
i=1 j=1
a1,0 = X a0,1 = Y m1,1 = a1,1 − a1,0 · a0,1 = Covarianza
N
p
k X
X
xi · yj · nij m2,0 = SX2 m0,2 = SY2
i=1 j=1
a1,1 =
N
7 8
• Distribuciones marginales
• Distribuciones condicionadas
9 10
Datos bivariantes: Distribución marginal de X Datos bivariantes: Distribución marginal de X
ni .
Frecuencia relativa marginal: fi . = N
• Varianza marginal:
X fi·
N k
x1 f1·
X X
(xi − X )2 xi2 ni. k
.. .. X
i=1 i=1
. . SX2 = = − (X )2 = xi2 fi. − (X )2
xk fk· N N
i=1
1
11 12
n. j
Frecuencia relativa marginal: f. j = N • Varianza marginal:
Y f·j N
X p
X
y1 f·1 (yj − Y )2 yj n.j
p
.. .. j=1 j=1 X
. . SY2 = = − (Y )2 = yj f.j − (Y )2
N N
j=1
yp f·p
1
13 14
nij fij
fj/i = =
ni . fi .
17
Representaciones gráficas de tablas de doble entrada Representaciones gráficas de tablas de doble entrada
Centro
Porcentajes
Sur 30
Sur
15
20
10
5 10
0
0
Mayorista Minorista Detalle
Mayorista Minorista Detalle
18 19
150
120
Relación entre variables
90
60
30
0
1700 2200 2700 3200 3700 4200 4700
WEIGHT 20
Asociación entre variables numéricas Asociación entre variables numéricas: Covarianza
Independencia
Diremos que dos variables son estadı́sticamente independientes si
• En la mayorı́a de los problemas de interés intervienen más de una nij ni· n·j
fij = fi· f·j ⇔ = ·
variable N N N
• El interés principal es el estudio de las relaciones entre las variables ¿Cómo medimos la dependencia?
presentes en el problema PN
i=1 (xi − X )(yi − Y )
SXY = Cov (X , Y ) = m1,1 =
N
• Suelen buscarse relaciones lineales entre las variables: Pk Pp
i=1 j=1 (xi − X )(yi − Y )nij
• Es el tipo de relación más simple =
N
• Muchas relaciones no lineales pueden linealizarse a través de p
k X
X
transformaciones = (xi − X )(yi − Y )fij
i=1 j=1
Pk Pp
i=1 j=1 ·xi · yj · nij
= −X ·Y
N
21 22
Asociación entre variables numéricas: Covarianza Asociación entre variables numéricas: Covarianza
Propiedades:
• Cov (b + X , Y ) = Cov (X , Y )
• Cov (b + a · X , d + c · Y ) = a · c · Cov (X , Y )
23 24
Asociación entre variables numéricas: Coeficiente de cor- Asociación entre variables numéricas: Coeficiente de cor-
relación relación
Propiedades
U =a·X +b
• Si |rXY | próximo a 1 −→ Asociación lineal importante
V =c ·Y +d
• Si |rXY | próximo a 0 −→ Asociación lineal débil rUV = rXY
Definición:
Definición:
!
SX2 SXY !
S= 1 rXY
SYX SY2 S=
rYX 1
Propiedades:
Propiedades:
• En la diagonal principal aparecen las varianzas
• Es simérica
• En las diagonales secundarias aparecen las covarianzas
• Es definida positiva
• Es simérica
• Es definida positiva
27 28