Ex Mayo 2015
Ex Mayo 2015
Ex Mayo 2015
2) Enunciar y demostrar el teorema que permite obtener la función lineal discriminante de Fisher
y demostrar el criterio de clasificación para esta función.
4) Dadas tres poblaciones bidimensionales con medias µ1 = (1, 0)0 , µ2 = (2, 0)0 y µ3 = (3, 0)0 y
matriz de covarianzas común µ ¶
1 1
V = ,
1 2
se pide:
4.1) Calcular la funciones discriminates lineales de cada grupo.
4.2) Clasificar al punto z = (2, 2)0 .
4.3) Dibujar las regiones de clasificación para cada grupo.
4.4) Calcular la función discriminate de Fisher para distinguir entre los grupos 1 y 3. Dar el
criterio de clasificación y usarlo para clasificar a z = (2, −1)0 .
v 0 V v ≥ t01 V t1 = λ1 t01 t1 = λ1 .
Pk
Sea c = (c , . . . , ck )0 las coordenadas de v en la base de vectores propios. Entonces v = i=1 ci ti y
Pk 2 1
i=1 ci = 1. Además:
Xk Xk Xk Xk k
X k
X
0 0 0 0
v Vv =( ci ti )V ( cj tj ) = ( ci ti )( cj V tj ) = ( λj cj ci ti tj ) = λi c2i ,
i=1 j=1 i=1 j=1 i,j=1 i=1
y se tiene
k
X
0
v Vv = λi c2i = λ1 .
i=1
Esto implica que ci = 0 para todo i tal que λi < λ1 (si no la desigualdad anterior sería estricta)
y v será una combinación lineal de vectores propios de un mismo valor propio λ1 y, por lo tanto,
también será vector propio de ese valor propio (el mayor).
3.2) ¿Cómo se puede interpretar Y1 si Xi representa la nota de un alumno en la asignatura i?
¿Existirá otra componente principal con todos sus coeficientes positivos? (razona la respuesta).
Sol. Si tomamos como t1 a ese vector propio con todos los coeficientes positivos, todas las
variables Xi influirán de forma positiva (en mayor o menor medida) en Y1 , por lo que Y1 nos
indicará lo bueno que es el alumno en general.
No, ya que el resto de vectores propios deben ser perpendiculares a t1 y, por lo tanto, el producto
escalar t01 ti debe ser cero. Esto es imposible si todos los coeficientes de ambos vectores son positivos.
La única opción sería que los coeficientes fuesen no negativos (por ejemplo (1, 0) y (0, 1)).
3.3) Calcular Y1 para µ ¶
1 1
V = .
1 2
¿Cuánta información tiene Y1 ?
Sol.: La ecuación característica es:
¯ ¯
¯ 1 1 ¯
¯ ¯ 2
¯ 1 2 ¯ = λ − 3λ + 1 = 0.
√ √
Las soluciones son λ1 = 3
2 + 1
2 5∼
= 2.618 y λ2 = 5∼ 3
2 − 1
= 0.382. Para calcular Y1 resolvemos el
2
sistema: µ ¶µ ¶ √ µ ¶
1 1 x 3+ 5 x
=
1 2 y 2 y
2
√
1+ 5
cuya solución general es y = 2 x. Por lo tanto una Y1 es:
√
2X1 + (1 + 5)X2 ∼
Y1 = p √ = 0.525X1 + 0.850X2
10 + 2 5
3
√
+ 12 5
y su información será I1 = 2
3 = 0.8726.
4) Dadas tres poblaciones bidimensionales con medias µ1 = (1, 0)0 , µ2 = (2, 0)0 y µ3 = (3, 0)0 y
matriz de covarianzas común µ ¶
1 1
V = ,
1 2
se pide:
3
6
z
2
−2 −1 0 1 2 3 4 5
x
Figura 1: Regiones de clasificación: 1 izquierda (negra), 2 centro (entre la negra y la roja), 3 derecha
(roja).
4.4) Calcular la función discriminate de Fisher para distinguir entre los grupos 1 y 3. Dar el
criterio de clasificación y usarlo para clasificar a z = (2, −1)0 .
Sol.:
Hacemos
L1 − L3 = 2x − y − 1 − (6x − 3y − 9) = −4x + 2y + 8
y obtenemos que L(x, y) = −4x + 2y y K = −8.
El criterio de clasificación es: z se clasifica en 1 (3) si