PLS-DA (Artículo)
PLS-DA (Artículo)
PLS-DA (Artículo)
Parte 1
Modelos lineales. PLS-DA
PLS-DA 1
Presentación
PRESENTACIÓN PLS-DA 2
Abstrac
The common steps to calibrate and validate classification models based on partial least squares
discriminant analysis are discussed in the present tutorial. All issues to be evaluated during model
training and validation are introduced and explained using a chemical dataset, composed of toxic
and non-toxic sediment samples. The analysis was carried out with MATLAB routines, which are
available in the ESI† of this tutorial, together with the dataset and a detailed list of all MATLAB
instructions used for the analysis.
Resumen
Los pasos comunes para calibrar y validar modelos de clasificación basados en el análisis
discriminante de mínimos cuadrados parciales se discuten en el presente tutorial. Todos los
problemas que se evaluarán durante el entrenamiento y la validación modelo se presentan y
explican utilizando un conjunto de datos químicos, compuesto de muestras de sedimentos tóxicos
y no tóxicos. El análisis se llevó a cabo con las rutinas de MATLAB, que están disponibles en el
ESI † de este tutorial, junto con el conjunto de datos y una lista detallada de todas las
instrucciones de MATLAB utilizadas para el análisis.
RESUMEN 3
1 Análisis discriminante de mínimos cuadrados parciales
Modelo clasificación
calibrado, asociado a
variables cualitativas y
cuantitativas.
Técnicas quimiométricas,
capaces de reconocer la
pertenencia de una muestra a
su clase apropiada.
• Mediciones • Pertenencia
químicas o categoría
PLS
Cuantitativo Cualitativo
4
1 Análisis discriminante de mínimos cuadrados parciales
PLS1
Variable Y dependiente …n filas (muestra)
clase)
…g columnas (inf.
PLS2 i-th i-th g-th
…n filas (muestra)
clase)
…g columnas (inf.
i-th i-th g-th
PLS-- 0 Variables
Relación
DA
Inversa
independientes
5
1 Análisis discriminante de mínimos cuadrados parciales
2 Datos experimentales 3 Software y código
http://michem.disat.unimib.it/chm/
0 1
Patrones de Relación
Probabilidad
distribución variable-clase
Fig 1. Diagrama de caja y bigotes a) Datos tratados Fig 2. Clasificación de valores Wilks’ Lambda
b) Datos no tratados
4 Análisis exploratorio 7
5 Selección de variables latentes
Validación cruzada Persianas-
venecianas 12 muestras 3
LV grupos CV 5 grupos CV (a y 10 grupos CV (c
b) y d)
Bloques contiguos
• [1,0,0,1,0,0,1,0,0,1,0,0] • [1,1,1,1,0,0,0,0,0,0,0,0] 2 y 5 LV 2 y 5 LV
• [0,1,0,0,1,0,0,1,0,0,1,0] • [0,0,0,0,1,1,1,1,0,0,0,0]
• [0,0,0,1,0,0,0,1,0,0,0,1] • [0,0,0,0,0,0,0,0,1,1,1,1]
20 y 18% error 20 y 18% error
12 y 10% No asignado 12 y 10% No asignado
Persianas-venecianas Bloques contiguos
𝑇𝑃 𝑇𝑁
(𝑇𝑃 + 𝐹𝑁) (𝐹𝑃 + 𝑇𝑁)
1-NER
• NER • ER
Ejemplo 1. Matriz confusión Tóxico P, No tóxico N Ejemplo 1. Matriz confusión Tóxico P, No tóxico N
Especificidad Sensibidad
No
• 0.8 < No tóxicos
tóxico
Umbral
0.258
Fig . 5 Gráfica de residuos Q vs. Hotelling T2 Fig. 6 Respuesta calculada frente a las muestras de entrenamiento
Hg,
Ag, • Bajas concentraciones
Cd
As, Ni,
• Valores absolutos,
Cr,
caracterización como
Zn,
Tóxicas
Pb, Cu
• En el presente tutorial, se presentaron y discutieron los pasos comunes para desarrollar y validar los
modelos de clasificación PLS-DA.
• Todos los problemas que se evaluaron durante el desarrollo del modelo se presentaron y explicaron
utilizando un conjunto de datos real, compuesto de muestras de sedimentos tóxicos y no tóxicos,
descritos por 9 variables químicas.
• Este análisis se llevó a cabo con las rutinas de MATLAB, que están disponibles en el ESI † de este
tutorial
15