Clasificaciones Supervisada y No Supervisadas
Clasificaciones Supervisada y No Supervisadas
Clasificaciones Supervisada y No Supervisadas
en la licencia Creative Commons Atribución. La licencia se aplica a todo el texto, así como las
imágenes creadas por el propio autor, que serán aquellas para las que no se especifique de modo
explícito una distinta procedencia.
Los nombres de productos o corporaciones que aparecen en el texto pueden constituir marcas
registradas y se emplean sin otro afán que el meramente identificativo. Asimismo, la inclusión o
no de uno de tales productos no expresa recomendación alguna por parte del autor.
CLASIFICACIÓN DE IMÁGENES EN TELEDETECCIÓN
Introducción a las técnicas de clasificación. Generación de clases
La elaboración de una clasificación del área de estudio en una serie de clases relativas a litología,
tipos de vegetación, usos del suelo, etc., es uno de los objetivos fundamentales en teledetección.
La clasificación en teledetección es, por tanto, un caso particular del problema general de
clasificar N individuos procedentes de una muestra en un conjunto de M < N clases en función
de una serie de K variables (X1,X2,...,XK). Este problema se resuelve en dos fases:
1. Determinación del número de clases y de las propiedades de estas en relación a las K variables
2. Asignar cada uno de los N individuos a una de las M clases utilizando una regla de decisión
basada en las propiedades de los individuos y las clases en relación a las K variables.
Sin embargo, además de esta información espectral puede utilizarse información textural e
información contextual. La información textural hace referencia a las características en la
vecindad de un pixel. Se definen una serie de variables (reflectividad media, varianza,
autocorrelación, etc.) que tratan de cuantificar algunas de las propiedades cualitativas que se
estudian en fotointerpretación. El contexto por su parte hace referencia a la necesaria
coherencia en cuanto a la clasificación de píxeles vecinos. No tendría, por ejemplo, mucho
sentido clasificar un pixel como cultivo de invernadero al lado de pixeles clasificados como
roquedo de alta montaña.
1. Clasificación supervisada.
Se parte de un conjunto de clases conocido a priori. Estas clases deben caracterizarse
en función del conjunto de variables mediante la medición de las mismas en individuos
cuya pertenencia a una de las clases no presente dudas (áreas de entrenamiento).
2. Clasificación no supervisada.
No se establece ninguna clase a priori, aunque es necesario determinar el número de
clases que queremos establecer, y dejar que las defina un procedimiento estadístico.
La asignación de cada uno de los individuos a las clases obtenidas anteriormente puede hacerse
mediante diferentes procedimientos:
Siguiendo con el ejemplo anterior los pixeles representados con tres colores diferentes
corresponden a tres clases diferentes obtenidas a partir de las áreas de entrenamiento.
Sin embargo, puesto que hemos creado las signaturas espectrales con varios píxeles de una
misma clase, lo que obtenemos no es una signatura en la que a cada banda se asigna un valor
de reflectividad, sino una distribución de reflectividades para cada banda con una serie de
estadísticos, los más relevantes para el análisis posterior son:
• Media
• Desviación típica
• Máximo
• Mínimo
Puede hacer varias pruebas. Al final deberá escoger 5 clases como producto a entregar.
La categoría o subcategoría se guarda en el “Panel para Clasificación”. Cada vez que guarde una
nueva, al seleccionar la herramienta “Crear un ROI de polígono” estará creando nuevas
categorías. Genere una subcategoría “Industrial”.
Otra categoría importante es la de “Suelo descubierto”. Trabajar con una combinación infrarroja
como 7 2 1 ayudará a discernir entre espacios con y sin vegetación.
Siempre que quiera añadir dos tipos de cobertura que el software no seleccione de acuerdo a
su propio criterio de semejanza de pixeles, puede presionando la tecla Ctrl seleccionar más de
una opción en “Activar el puntero ROI”.
Otra categoría sería “Pasto y zonas verdes”
Una de las ventajas del plugin SCP es que permite previsualizar los resultados de una
clasificación. Se trata de la herramienta “Activar el puntero para clasificación preliminar”.
Desde un punto de vista espectral, parece previsible que las cubiertas más problemáticas de
cara a su distinción son precisamente el cafetal de los bosques.
Una vez validada la clasificación preliminar, se puede generar un ráster reclasificado.
Una forma de saber la fiabilidad o representatividad de las ROI’s, además de la separabilidad
espectral de las áreas de entrenamiento, es observar los gráficos o diagramas de dispersión:
El gráfico de dispersión permite valorar la correlación entre regiones de entrenamiento y su
ubicación espectral.
Active dicha herramienta y analice/compare las bandas más correlacionadas y las coberturas
más difícilmente separables.
Active la herramienta y mediante un clic sobre cada ROI o área de entrenamiento, se desplegará
el cuadro de diálogo de “Resultados de la identificación”. Analice e interprete el ND por banda,
asociado al pixel seleccionado (en la opción de visualización “Árbol”) y la firma espectral
correspondiente (en la opción de visualización “Grafo”) para cada una de las cubiertas
seleccionadas. Para ello podrá apoyarse en las características espectrales que tiene cada banda
WorldView2, es decir, su longitud de onda y el rango espectral.
Puesto que cada clase dispone de una reflectividad media para cada una de las bandas, podemos
situar cada una de las clases como un centroide en un espacio de variables. Es este espacio de
variables se puede calcular la distancia entre un pixel y una clase.
Este método no es demasiado bueno ya que sobreclasifica la imagen, es decir ningún pixel
queda sin clasificar. Aunque algunos autores señalan esto como una ventaja, realmente es un
problema ya que es preferible dejar áreas sin clasificar que clasificarlas sin garantías. Se han
propuesto diversos métodos para forzar la clasificación de todos los píxeles a una u otra clase.
Sin embargo lo más adecuado sería cartografiar estos píxeles con problemas de clasificación
para determinar cuál es la razón e intentar solventarla. Normalmente serán los pixeles de borde
los que den problemas de clasificación por su propia naturaleza mixta. Por otro lado no se tiene
en cuenta las desviaciones típicas de cada una de las bandas para cada una de las clases, así un
clase con una baja desviación típica no debería absorber pixeels alejados de su centroide, como
en la imagen:
Clasificación por máxima probabilidad
Puesto que se tiene la media y la desviación típica de cada una de las clases, se puede utilizar
algún modelo de distribución de probabilidad. El clasificador de máxima probabilidad asume que
los datos siguen una función de distribución normal para asignar la probabilidad de que un pixel
cualquiera pertenezca a cada una de las clases. El pixel se asigna de este modo a la clase a la que
es más probable que pertenezca.
Este método puede usarse de forma automática, o puede establecerse algún criterio que
permita asignar pixeles a una clase sólo si la probabilidad correspondiente es superior a
determinado umbral. Permite por otro lado definir algún tipo de criterio para medir la calidad
de la asignación, por ejemplo la diferencia entre la máxima probabilidad y la siguiente.
En la figura siguiente aparecen una serie de elipses rodeando a cada uno de los centroides, se
trata de líneas de isoprobabilidad, por tanto el pixel se clasificará como perteneciente a la clase
en la que sus valores resulten más probables.
El problema con este método es que se parte de la hipótesis de que los datos de reflectividad
siguen una distribución normal no siempre se cumple y debería verificarse siempre.
Este algoritmo, mide la similitud entre un espectro desconocido t, con uno referencial r, en n-
dimensiones. Estos espectros son tratados como vectores en n-espacios y el ángulo que forman
se denomina "ángulo espectral". Este valor en radianes es asignado al píxel correspondiente en
la imagen resultante SAM, es una clasificación supervisada en la que cada color de la imagen
representa un tipo de material seleccionado.
Acciones recomedadas:
Analice los errores que eventualmente pudieran haberse producido relacionándolos con
la respuesta espectral de las diferentes cubiertas.
Realice varias pruebas cambiando los ROI’s si fuera necesario, hasta obtener una
clasificación más satisfactoria, es decir, más acorde con la realidad.
La clasificación no supervisada
La clasificación no supervisada no requiere de nuestra intervención en el proceso de selección y
agrupamiento de clases. El primer paso en una clasificación no supervisada es crear clusters.
Estadísticamente, los clusters son agrupaciones que ocurren naturalmente en los datos. La
herramienta Cluster ISO requiere bandas del ráster de entrada, el número de clases, el nombre
del archivo de firma de salida, el número de iteraciones y el tamaño mínimo de clase.
El nombre del algoritmo utilizado para crear clusters en una clasificación no supervisada es
Cluster ISO. El prefijo ISO del algoritmo de clustering de isodatos significa Organización
automática iterativa, como método de realizar el clustering. Los clusters se calculan utilizando
un subconjunto de celdas en el área de estudio.
Todos los cálculos de cluster se llevan a cabo en los valores de celda en el espacio de atributos
multivariantes y no se basan en características espaciales. Es decir, el valor medio se deriva de
los valores de atributos para las distintas bandas de entrada. Los valores de varianza y
covarianza se calculan a partir de la variación dentro y entre bandas.
El algoritmo utilizado es el siguiente:
Donde:
Si la entrada es una capa creada desde un ráster multibanda con más de tres bandas, la
operación considerará todas las bandas asociadas con el dataset de origen, no sólo las tres
bandas que fueron cargadas (simbolizadas) por la capa.
El siguiente ejemplo utiliza un enfoque de clustering ISO o valor medio K. Un ráster de dos
bandas se utilizará para explicar la metodología teóricamente. Esta misma metodología trabaja
por el total de bandas que se introducen, o en un espacio dimensional n. La siguiente discusión
es conceptual para permitir una mejor comprensión del enfoque de clustering ISO.
Se realiza un gráfico vacío con el rango de valores en la primera banda que se graficó en
el eje x y el rango de valores en la segunda banda que se graficó en el eje y.
Se dibuja una línea de 45 grados y se divide en el número de clases que especifica. El
punto central de cada uno de estos segmentos de línea es el valor medio inicial para las
clases.
Cada celda de muestra se dibuja en el gráfico y la distancia desde el punto a cada punto
central medio se determina en la línea de 45 grados. La distancia se calcula en el espacio
de atributos utilizando el teorema de Pitágoras. Se asigna el punto de muestra al cluster
representado por el punto central medio más cercano.
El clustering es sensible al rango de valores en cada banda. Este rango de valores determina los
valores en el eje x e y desde donde se calculan las distancias euclidianas entre los puntos medio
y de muestra. Para que los atributos de cada banda se consideren iguales, el rango de valor
para cada banda debe ser similar, ya sea al realizar una clasificación supervisada o un
clustering no supervisado. Cuando el rango de valor de una banda es pequeño en relación a las
otras bandas, la distancia euclidiana en un espacio multivariante puede ser tan pequeño que
varios clusters resultarán en un valor medio de cero. Si uno de los clusters tiene un valor medio
de cero, la clasificación final y cualquier otra herramienta multivariante que depende de un
archivo de firma fallará. Sería ideal que todas las bandas se normalicen al mismo rango de
valor.
Seguidamente, seleccione los siguientes parámetros. Puede optar por 3 métodos distintos de
agrupamiento o Clustering. Escoja en este caso el mixto (Combined Minimum
Distance/Hillclimbing) que se muestra en el videotutorial, pero siempre es conveniente
comparar resultados y escoger el que le proporcione un mejor resultado, en función de las
distintas clases o agrupaciones generadas.
Productos informativos a entregar: Deberá entregar dos capturas de pantalla; una clasificación
supervisada y una no supervisada de 5 clases en ambos casos, de cualquier sector de su área
de estudio a escala 1:7000, debemos de garantizar que la escala sea lo más optima posible