Analisis Multivariado
Analisis Multivariado
Analisis Multivariado
TEMA
Investigacin Anlisis Multivariado
(Anlisis Discriminante)
Contenido
INTRODUCCIN............................................................................................................... 3
OBJETIVOS....................................................................................................................... 4
General........................................................................................................................... 4
Especficos...................................................................................................................... 4
CONCEPTO GENERAL ANALISIS MULTIVARIADO...............................................................5
ANALISIS DISCRIMINANTE...............................................................................................7
MODELO MATEMATICO........................................................................................... 12
DESCOMPOSICION DE LA VARIANZA.......................................................................12
EXTRACCION DE LA FUNCIONES DISCRIMINANTES.................................................12
PROCEDIMIENTO MATRICIAL...................................................................................12
Aplicacin del El anlisis discriminante.........................................................................13
Visin geomtrica del anlisis discriminante.................................................................13
Anlisis Discriminante con SPSS...................................................................................17
Seleccin de las variables discriminantes.....................................................................18
Estadsticos usados....................................................................................................... 19
Variables originales que se consideran.........................................................................20
En el SPSS se considera tambin para cada variable la tolerancia asociada.................21
Tolerancia...................................................................................................................... 21
Clculo de la F y de la de Wilks multivariantes para fijar los criterios de entrada y
salida............................................................................................................................ 21
Estadsticos que se calculan en el procedimiento stepwise...........................................22
F de entrada (F to enter)............................................................................................... 22
F de salida (F to remove):............................................................................................. 22
Correlacin Cannica.................................................................................................... 23
Significacin y coeficientes de las funciones discriminantes.........................................23
Interpretacin de los coeficientes de la funcin discriminante......................................24
Matriz de estructura...................................................................................................... 24
Clasificacin de los objetos........................................................................................... 24
Regla de Bayes............................................................................................................. 25
Matriz de confusin....................................................................................................... 26
Ejemplos....................................................................................................................... 27
Conclusiones................................................................................................................. 40
E-GRAFIA....................................................................................................................... 41
Anlisis Discriminante
Pgina 2
INTRODUCCIN
La siguiente investigacin primeramente hace una resea de los anlisis Multivariado de
estadstica y sus divisiones.
A continuacin se hace un detalle del anlisis discriminante que se basa en encontrar la
combinacin lineal de las variables independientes que mejor permiten diferenciar en este
caso diremos discriminar a los grupos. Al haber encontrado esta combinacin la cual
llamaremos funcin discriminante se podr clasificar en casos y as aprovechar las
relaciones existentes entre una gran cantidad de variables independientes para maximizar
la capacidad de diferenciar.
El anlisis discriminante es muy similar al anlisis de varianza multivariante de un factor
ya que su propsito es el mismo, lo que en realidad lo diferencia es que solo admite
variables cuantitativas y si alguna de las variables independientes es categrica, es
preferible utilizar otro mtodo de anlisis.
Anlisis Discriminante
Pgina 3
OBJETIVOS
General
Estudiar otra tcnica del anlisis multivariado, especficamente la del anlisis
discriminante.
Especficos
Definir que es el anlisis de discriminante, sus conceptos bsicos y su aplicacin.
Presentar ejemplos de la aplicacin del anlisis discriminante.
Pgina 4
Tcnicas de la dependencia
Tcnicas de interdependencia
Mtodos estructurales
TECNICAS DE LA DEPENDENCIA
TECNICAS INTERDEPENDIENTES
Anlisis Discriminante
Pgina 5
METODOS ESTRUCTURALES
ANALISIS DISCRIMINANTE
A continuacin se representa grficamente donde se encuentra ubicado el anlisis
discriminante en relacin al anlisis de dependencias:
Anlisis Discriminante
Pgina 6
Anlisis Discriminante
Pgina 7
Anlisis Discriminante
Pgina 8
Anlisis Discriminante
Pgina 9
De igual modo sustituyendo las medias del grupo 2, obtenemos el centroide del grupo 2:
Pgina 10
Siendo P (I) y P (II) las prevalencias de cada grupo, C1 y C2 los costes de clasificacin
incorrecta anteriormente definidos, y si denominamos
Anlisis Discriminante
Pgina 11
DESCOMPOSICION DE LA VARIANZA
Se puede descomponer la variabilidad total de la muestra en variabilidad dentro de los
grupos y entre los grupos.
PROCEDIMIENTO MATRICIAL
Se sigue un mtodo parecido al anlisis factorial, en el cual se busca una funcin lineal de
modo que la variabilidad entre grupos ms la variabilidad dentro de grupos.
Para maximizar la variabilidad entre los grupos para discriminarlos mejor y esto equivale a
hacer,
Anlisis Discriminante
Pgina 12
Pgina 13
Como el director del banco tiene el historial de los crditos pasados que concedi,
sabe qu nivel de ingresos tenan los solventes y los insolventes. De esta
informacin podra obtenerse fcilmente la figura 4.
Anlisis Discriminante
Pgina 14
Anlisis Discriminante
Pgina 15
Pgina 16
Anlisis Discriminante
Pgina 17
Pgina 18
Estadsticos usados
F de Snedecor se compara para cada variable las desviaciones de las medias de
cada uno de los grupos a la media total, entre las desviaciones a la media dentro
de cada grupo.
Si F es grande para cada variable, entonces las medias de cada grupo estn muy
separadas y la variable discrimina bien. Si F es pequea, la variable discriminar
poco, ya que habr poca homogeneidad en los grupos y stos estarn muy
prximos.
de Wilks Tambin se la denomina U-estadstico. Cuando se considera a las
variables de modo individual, la es igual al cociente entre la suma de cuadrados
dentro de los grupos y la suma de cuadrados total (sin distinguir grupos). Es decir,
equivale a las desviaciones a la media dentro de cada grupo, entre las
desviaciones a la media total sin distinguir grupos. Si su valor es pequeo, la
Anlisis Discriminante
Pgina 19
Anlisis Discriminante
Pgina 20
se obtiene el
coeficiente de determinacin.
Entonces, la tolerancia se define como 1 R 2i . As, cuanto mayor sea la tolerancia
de una variable, ms informacin independiente del resto de variables recoger.
De este modo, si en una iteracin dada del procedimiento stepwise la variable
seleccionada verifica que su tolerancia con respecto a las variables ya incluidas en
la funcin discriminante es muy pequea entonces la variable no se incluye en
dicha etapa. As, se evita la redundancia de informacin.
donde
|B| = determinante de la matriz de covarianzas entre grupos.
Anlisis Discriminante
Pgina 21
donde
n = nmero de observaciones
k = nmero de grupos
p = nmero de variables
La F y la de Wilks se interpretan del mismo modo que en el caso univariante.
Cuando se comparan covarianzas entre grupos, se hace en base a los centroides
de los grupos, es decir, a los vectores de medias de las variables en cada grupo.
F de salida (F to remove):
Expresa el incremento que se produce en la de Wilks, si se elimina de la funcin
discriminante una variable dada. Si el valor de la F de salida es pequeo, el
incremento no ser significativo y la variable se eliminar del anlisis.
Anlisis Discriminante
Pgina 22
Correlacin Cannica
Da una medida del grado de asociacin entre las puntuaciones discriminantes de
cada uno de los objetos y el grupo concreto de pertenencia
de modo que V 2
p(k1)
Pgina 23
Matriz de estructura
Otra forma de calcular la contribucin de cada variable a una funcin discriminante
es examinar las correlaciones entre los valores de la funcin y los valores de las
variables.
Se calculan, dentro de cada grupo, las correlaciones entre las variables y las
puntuaciones; luego se combinan en una matriz pooled within-groups correlation
matrix. Los valores obtenidos dan una medida de las contribuciones.
Anlisis Discriminante
Pgina 24
Regla de Bayes
Se pueden usar las puntuaciones discriminantes para obtener una regla para
clasificar los casos en los grupos. En el SPSS se usa la regla de Bayes.
As, la probabilidad de que un objeto j, con una puntuacin discriminante D =
(yj1, ..., yjm), pertenezca al grupo i-simo se puede estimar mediante la regla de
Bayes:
Anlisis Discriminante
Pgina 25
como una normal, cuya media y varianza se estiman a partir de todas las
puntuaciones que se recogen en el grupo i-simo.
P (Gi|D) es la probabilidad a posteriori que se estima a travs de P (G i) y de P (D|
Gi).
En realidad, mide lo mismo que la P (G i), pero refina la medida de incertidumbre al
tener en cuenta la informacin que recogen las puntuaciones discriminantes D. Es
decir, lo que interesa es calcular la probabilidad de que un objeto pertenezca al
grupo Gi, dado que presenta la puntuacin D.
Se asignar un objeto al grupo G i cuya probabilidad a posteriori sea mxima, es
decir, dado que presenta la puntuacin D.
Matriz de confusin
Da una idea de la tasa de clasificaciones incorrectas. Como se sabe el grupo al
que pertenece cada objeto, se puede comprobar la efectividad del mtodo de
clasificacin usando la mxima probabilidad a posteriori, cuando se observa el
porcentaje de casos bien clasificados. No obstante, se tiene que tener en cuenta
tambin la tasa de clasificaciones incorrectas esperadas segn las probabilidades
a priori.
Anlisis Discriminante
Pgina 26
Ejemplo
Se consideran los datos recogidos sobre 32 crneos en el Tibet.
Anlisis Discriminante
Pgina 27
Los datos corresponden a dos tipos raciales diferentes en los que se practicaron
diferentes medidas antropomtricas de longitudes, anchuras de crneo y de cara.
Se trata de hacer un anlisis discriminante sobre los dos tipos raciales.
Se toma una muestra de 50 vehculos producidos en EE.UU, Japn y Europa. Se
consideran las siguientes variables: Consumo, Cilindrada, Potencia, Peso,
Aceleracin, Ao del modelo y Nmero de cilindros. Se trata de hacer un anlisis
discriminante sobre los tres tipos de vehculos, en funcin de su origen.
Anlisis Discriminante
Pgina 28
Anlisis Discriminante
Pgina 29
Anlisis Discriminante
Pgina 30
Pgina 31
de esta tabla suele utilizarse como prueba preliminar para detectar si los grupos
difieren en las variables de clasificacin seleccionadas; sin embargo, debe tenerse
en cuenta que una variable no significativa a nivel univariante podra aportar
informacin discriminativa a nivel multivariante.
Correlacin
intra-grupos.
Muestra
la
matriz
de
correlaciones
intra-grupo
Anlisis Discriminante
Pgina 32
Anlisis Discriminante
Pgina 33
Anlisis Discriminante
Pgina 34
Anlisis Discriminante
Pgina 35
Anlisis Discriminante
Pgina 36
Anlisis Discriminante
Pgina 37
Anlisis Discriminante
Pgina 38
Anlisis Discriminante
Pgina 39
Anlisis Discriminante
Pgina 40
Conclusiones
El anlisis discriminante es una tcnica de clasificacin donde se busca obtener una
funcin la cual clasifica sujeto a partir del conocimiento de los valores de ciertas variables
que pueden discriminarse.
Se deben conocer las caractersticas de los grupos antes del anlisis; as tambin a qu
grupo son miembros ciertos individuos de los que tambin se conoce sus valores en las
variables discriminantes.
Para el clculo de las variables discriminantes es necesario contar con un software de
anlisis de datos tal como SPSS.
El anlisis discriminante es un anlisis ayuda a comprender las diferencias entre grupos;
as mismo da razn mediante funciones de variables mtricas del porqu los casos de
estudio se encuentran asociados a distintos niveles de un factor.
Anlisis Discriminante
Pgina 41
E-GRAFIA
https://estadisticaorquestainstrumento.wordpress.com/2013/01/04/tema-20-analisisdiscriminante/
https://www.uam.es/personal_pdi/economicas/eva/pdf/discriminante.pdf
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/SEGMENTACION/DISCRIMI
NANTE/analisis-discriminante.pdf
http://www.ugr.es/~bioestad/_private/cpfund8.pdf
http://pendientedemigracion.ucm.es/info/socivmyt/paginas/D_departamento/materiales/an
alisis_datosyMultivariable/23discr_SPSS.pdf
https://es.wikipedia.org/wiki/Significaci%C3%B3n_estad%C3%ADstica
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMult/tema6am.pdf
Anlisis Discriminante
Pgina 42