Clasificaciones Supervisada y No Supervisadas

Se concede permiso para copiar, distribuir o modificar esta obra bajo los términos expresados
en la licencia Creative Commons Atribución. La licencia se aplica a todo el texto, así como las
imágenes creadas por el propio autor, que serán aquellas para las que no se especifique de modo
explícito una distinta procedencia.
Los nombres de productos o corporaciones que aparecen en el texto pueden constituir marcas
registradas y se emplean sin otro afán que el meramente identificativo. Asimismo, la inclusión o
no de uno de tales productos no expresa recomendación alguna por parte del autor.
CLASIFICACIÓN DE IMÁGENES EN TELEDETECCIÓN
Introducción a las técnicas de clasificación. Generación de clases
La elaboración de una clasificación del área de estudio en una serie de clases relativas a litología,
tipos de vegetación, usos del suelo, etc., es uno de los objetivos fundamentales en teledetección.
La clasificación en teledetección es, por tanto, un caso particular del problema general de
clasificar N individuos procedentes de una muestra en un conjunto de M < N clases en función
de una serie de K variables (X1,X2,...,XK). Este problema se resuelve en dos fases:
1. Determinación del número de clases y de las propiedades de estas en relación a las K variables
2. Asignar cada uno de los N individuos a una de las M clases utilizando una regla de decisión
basada en las propiedades de los individuos y las clases en relación a las K variables.
En teledetección el conjunto de variables está compuesto por la reflectividad en cada una de

las bandas.
Sin embargo, además de esta información espectral puede utilizarse información textural e
información contextual. La información textural hace referencia a las características en la
vecindad de un pixel. Se definen una serie de variables (reflectividad media, varianza,
autocorrelación, etc.) que tratan de cuantificar algunas de las propiedades cualitativas que se
estudian en fotointerpretación. El contexto por su parte hace referencia a la necesaria
coherencia en cuanto a la clasificación de píxeles vecinos. No tendría, por ejemplo, mucho
sentido clasificar un pixel como cultivo de invernadero al lado de pixeles clasificados como
roquedo de alta montaña.
La incorporación de información textural y contextual tiene, sin embargo, el inconveniente de

introducir variables que no suelen seguir una distribución gaussiana con lo que algunos
métodos de clasificación no funcionan correctamente.
La determinación de las clases puede hacerse básicamente mediante dos criterios:
1. Clasificación supervisada.
Se parte de un conjunto de clases conocido a priori. Estas clases deben caracterizarse
en función del conjunto de variables mediante la medición de las mismas en individuos
cuya pertenencia a una de las clases no presente dudas (áreas de entrenamiento).
2. Clasificación no supervisada.
No se establece ninguna clase a priori, aunque es necesario determinar el número de
clases que queremos establecer, y dejar que las defina un procedimiento estadístico.
La asignación de cada uno de los individuos a las clases obtenidas anteriormente puede hacerse
mediante diferentes procedimientos:
• No estadísticos (árboles de decisión, mínima distancia, paralelepípedos)
• Estadísticos clásicos (máxima probabilidad)
• Algoritmos basados en inteligencia artificial (lógica borrosa, redes neuronales)
• Algoritmos que utilizan información contextual

Clasificación supervisada
La clasificación supervisada se basa en la disponibilidad de áreas de entrenamiento. Se trata de
áreas de las que se conoce a priori la clase a la que pertenecen y que servirán para generar una
signatura espectral característica de cada una de las clases. Se denominan clases
informacionales en contraposición a las clases espectrales que genera la clasificación no
supervisada. Las áreas de entrenamiento deben ser lo más homogéneas posibles y en las que
sepamos lo que había el día que se tomó la imagen. Por ello esta operación se realiza el mismo
día en el que el satélite toma la imagen y luego se adquiere ésta. Otra posibilidad es utilizar
fotografía aérea o información de otro tipo.
Siguiendo con el ejemplo anterior los pixeles representados con tres colores diferentes
corresponden a tres clases diferentes obtenidas a partir de las áreas de entrenamiento.
Sin embargo, puesto que hemos creado las signaturas espectrales con varios píxeles de una
misma clase, lo que obtenemos no es una signatura en la que a cada banda se asigna un valor
de reflectividad, sino una distribución de reflectividades para cada banda con una serie de
estadísticos, los más relevantes para el análisis posterior son:
• Media
• Desviación típica
• Máximo
• Mínimo
Clasificación Supervisada con Semiautomatic Classification en

imágenes WorldView2
WorldView-2
WorldView-2, lanzado en octubre de 2009, es el primer satélite comercial
multiespectral de 8 bandas de alta resolución. WorldView-2 opera a una altura
de 770 kilómetros y proporciona una resolución pancromática de 46 cm y una
resolución multiespectral de 1.85 m. WorldView-2 tiene un tiempo de revisita
promedio de 1.1 días, y puede recolectar hasta 1 millón de km2 de imágenes de
8 bandas por día, lo cual mejora en gran medida la capacidad de recolección
de imágenes multiespectrales de Digital Globe para una obtención más rápida
y confiable.
PROCEDIMIENTO
Añada la imagen multiespectral y escoja una combinación de bandas que permita distinguir las
diferentes coberturas en torno al Aeropuerto Internacional Juan Santamaría (Costa Rica).
En la barra de herramientas de SCP deberá crear un archivo de entrenamiento
Las clases que se van a crear pueden ser:
- Vivienda o residencial combinables

- Industrial
- Comunicaciones
- Cuerpos de agua
- Suelo descubierto
- Bosque
- Pastos y cultivos combinables
Puede hacer varias pruebas. Al final deberá escoger 5 clases como producto a entregar.
Seguidamente puede generar una macroclase urbana, con la subcategoría “Vivienda”:
Después, en la barra de herramientas SCP seleccione “Crear un ROI de polígono”

Y digitalice un sector representativo de la subcategoría “Vivienda”
Después de seleccionar cada categoría, pulse “Guardar el ROI temporal en el Entrenamiento de

Entrada”.
La categoría o subcategoría se guarda en el “Panel para Clasificación”. Cada vez que guarde una
nueva, al seleccionar la herramienta “Crear un ROI de polígono” estará creando nuevas
categorías. Genere una subcategoría “Industrial”.
Para las infraestructuras de comunicación (carreteras) se podría escoger la opción “Activar el

puntero ROI” en lugar de “Crear un ROI de polígono”.
Prosiga con la categoría, “Cuerpos de agua”:
Otra categoría importante es la de “Suelo descubierto”. Trabajar con una combinación infrarroja
como 7 2 1 ayudará a discernir entre espacios con y sin vegetación.
Siempre que quiera añadir dos tipos de cobertura que el software no seleccione de acuerdo a
su propio criterio de semejanza de pixeles, puede presionando la tecla Ctrl seleccionar más de
una opción en “Activar el puntero ROI”.
Otra categoría sería “Pasto y zonas verdes”
Otra sería “Bosque”

Por último, “cafetales”:
Una de las ventajas del plugin SCP es que permite previsualizar los resultados de una
clasificación. Se trata de la herramienta “Activar el puntero para clasificación preliminar”.
Desde un punto de vista espectral, parece previsible que las cubiertas más problemáticas de
cara a su distinción son precisamente el cafetal de los bosques.
Una vez validada la clasificación preliminar, se puede generar un ráster reclasificado.
Una forma de saber la fiabilidad o representatividad de las ROI’s, además de la separabilidad
espectral de las áreas de entrenamiento, es observar los gráficos o diagramas de dispersión:
El gráfico de dispersión permite valorar la correlación entre regiones de entrenamiento y su
ubicación espectral.
Active dicha herramienta y analice/compare las bandas más correlacionadas y las coberturas
más difícilmente separables.
Otra herramienta útil a la hora de interpretar el comportamiento reflectivo de las diferentes

cubiertas es el comando “Identificar objetos espaciales” de QGIS.
Active la herramienta y mediante un clic sobre cada ROI o área de entrenamiento, se desplegará
el cuadro de diálogo de “Resultados de la identificación”. Analice e interprete el ND por banda,
asociado al pixel seleccionado (en la opción de visualización “Árbol”) y la firma espectral
correspondiente (en la opción de visualización “Grafo”) para cada una de las cubiertas
seleccionadas. Para ello podrá apoyarse en las características espectrales que tiene cada banda
WorldView2, es decir, su longitud de onda y el rango espectral.
En realidad, a la hora de aplicar una clasificación, existen múltiples algoritmos de

agrupamiento/separabilidad de pixeles. QGIS contiene tres:
Distancia mínima Máxima probabilidad Ángulo espectral

Clasificación por distancia mínima
Puesto que cada clase dispone de una reflectividad media para cada una de las bandas, podemos
situar cada una de las clases como un centroide en un espacio de variables. Es este espacio de
variables se puede calcular la distancia entre un pixel y una clase.
Evidentemente el pixel X se asignará a la clase respecto a la cual su distancia sea mínima. En

definitiva, se definen una serie de hiperesferas que rellenan el hiperespacio de variables sin
intersectarse.
Este método no es demasiado bueno ya que sobreclasifica la imagen, es decir ningún pixel
queda sin clasificar. Aunque algunos autores señalan esto como una ventaja, realmente es un
problema ya que es preferible dejar áreas sin clasificar que clasificarlas sin garantías. Se han
propuesto diversos métodos para forzar la clasificación de todos los píxeles a una u otra clase.
Sin embargo lo más adecuado sería cartografiar estos píxeles con problemas de clasificación
para determinar cuál es la razón e intentar solventarla. Normalmente serán los pixeles de borde
los que den problemas de clasificación por su propia naturaleza mixta. Por otro lado no se tiene
en cuenta las desviaciones típicas de cada una de las bandas para cada una de las clases, así un
clase con una baja desviación típica no debería absorber pixeels alejados de su centroide, como
en la imagen:
Clasificación por máxima probabilidad
Puesto que se tiene la media y la desviación típica de cada una de las clases, se puede utilizar
algún modelo de distribución de probabilidad. El clasificador de máxima probabilidad asume que
los datos siguen una función de distribución normal para asignar la probabilidad de que un pixel
cualquiera pertenezca a cada una de las clases. El pixel se asigna de este modo a la clase a la que
es más probable que pertenezca.
Este método puede usarse de forma automática, o puede establecerse algún criterio que
permita asignar pixeles a una clase sólo si la probabilidad correspondiente es superior a
determinado umbral. Permite por otro lado definir algún tipo de criterio para medir la calidad
de la asignación, por ejemplo la diferencia entre la máxima probabilidad y la siguiente.
En la figura siguiente aparecen una serie de elipses rodeando a cada uno de los centroides, se
trata de líneas de isoprobabilidad, por tanto el pixel se clasificará como perteneciente a la clase
en la que sus valores resulten más probables.
El problema con este método es que se parte de la hipótesis de que los datos de reflectividad
siguen una distribución normal no siempre se cumple y debería verificarse siempre.
Clasificación por ángulo espectral
Este algoritmo, mide la similitud entre un espectro desconocido t, con uno referencial r, en n-
dimensiones. Estos espectros son tratados como vectores en n-espacios y el ángulo que forman
se denomina "ángulo espectral". Este valor en radianes es asignado al píxel correspondiente en
la imagen resultante SAM, es una clasificación supervisada en la que cada color de la imagen
representa un tipo de material seleccionado.
Se trata de un algoritmo sencillo basado en la medida de la similitud espectral entre dos

espectros. Esta similitud espectral, α, se obtiene considerando cada espectro como un
vector en un espacio n dimensional del siguiente modo:
Donde n es el número de bandas espectrales y e1 y e2 son los dos espectros que se están
comparando. Un ángulo α pequeño indica elevada similitud entre los espectros, mientras
que ángulos elevados indican baja similitud.
Acciones recomedadas:
 Analice los errores que eventualmente pudieran haberse producido relacionándolos con
la respuesta espectral de las diferentes cubiertas.
 Realice varias pruebas cambiando los ROI’s si fuera necesario, hasta obtener una
clasificación más satisfactoria, es decir, más acorde con la realidad.
La clasificación no supervisada
La clasificación no supervisada no requiere de nuestra intervención en el proceso de selección y
agrupamiento de clases. El primer paso en una clasificación no supervisada es crear clusters.
Estadísticamente, los clusters son agrupaciones que ocurren naturalmente en los datos. La
herramienta Cluster ISO requiere bandas del ráster de entrada, el número de clases, el nombre
del archivo de firma de salida, el número de iteraciones y el tamaño mínimo de clase.
La herramienta devuelve un archivo de firma que contiene estadísticas multivariantes para un

subconjunto de las celdas para los clusters identificados. Los cálculos resultantes identifican qué
ubicación de celda pertenece a qué cluster, el valor medio para el cluster y la matriz de varianza-
covarianza.
El nombre del algoritmo utilizado para crear clusters en una clasificación no supervisada es
Cluster ISO. El prefijo ISO del algoritmo de clustering de isodatos significa Organización
automática iterativa, como método de realizar el clustering. Los clusters se calculan utilizando
un subconjunto de celdas en el área de estudio.
Todos los cálculos de cluster se llevan a cabo en los valores de celda en el espacio de atributos
multivariantes y no se basan en características espaciales. Es decir, el valor medio se deriva de
los valores de atributos para las distintas bandas de entrada. Los valores de varianza y
covarianza se calculan a partir de la variación dentro y entre bandas.
El algoritmo utilizado es el siguiente:
Donde:
 Z es el raster de salida con las nuevas clases.

 X es el raster de entrada.
 Oldmin es el valor mínimo del raster de entrada.
 Oldmax es el valor máximo del raster de entrada.
 Newmin es el es el valor mínimo deseado para el raster de salida.
 Newmax es el valor máximo deseado para el raster de salida.
Si la entrada es una capa creada desde un ráster multibanda con más de tres bandas, la
operación considerará todas las bandas asociadas con el dataset de origen, no sólo las tres
bandas que fueron cargadas (simbolizadas) por la capa.
El siguiente ejemplo utiliza un enfoque de clustering ISO o valor medio K. Un ráster de dos
bandas se utilizará para explicar la metodología teóricamente. Esta misma metodología trabaja
por el total de bandas que se introducen, o en un espacio dimensional n. La siguiente discusión
es conceptual para permitir una mejor comprensión del enfoque de clustering ISO.
 Se realiza un gráfico vacío con el rango de valores en la primera banda que se graficó en
el eje x y el rango de valores en la segunda banda que se graficó en el eje y.
 Se dibuja una línea de 45 grados y se divide en el número de clases que especifica. El
punto central de cada uno de estos segmentos de línea es el valor medio inicial para las
clases.
 Cada celda de muestra se dibuja en el gráfico y la distancia desde el punto a cada punto
central medio se determina en la línea de 45 grados. La distancia se calcula en el espacio
de atributos utilizando el teorema de Pitágoras. Se asigna el punto de muestra al cluster
representado por el punto central medio más cercano.
Se calcula la distancia desde cada punto al punto central medio.
 Se grafica el siguiente punto de muestra y se repite el procedimiento anterior para todos

los puntos de muestra.
Se calcula la distancia para todos los puntos de muestra.

El procedimiento anterior itera. Antes de la próxima iteración, se calcula un nuevo punto
central medio para cada cluster basado en los valores de las ubicaciones de celda asignados
al cluster en la iteración anterior. Con el nuevo punto central medio para cada cluster, se
repiten los dos pasos anteriores.
Se calculan los nuevos puntos centrales medios para cada clase.
 Se actualizan los valores medios, y se repite el paso anterior. El proceso de iteración

para actualizar los valores medios sigue hasta alcanzar el número de iteraciones definido
por el usuario o hasta que menos del 2 por ciento de las celdas cambian de un cluster a
otro en relación a los valores medios nuevos en una iteración.
El clustering es sensible al rango de valores en cada banda. Este rango de valores determina los
valores en el eje x e y desde donde se calculan las distancias euclidianas entre los puntos medio
y de muestra. Para que los atributos de cada banda se consideren iguales, el rango de valor
para cada banda debe ser similar, ya sea al realizar una clasificación supervisada o un
clustering no supervisado. Cuando el rango de valor de una banda es pequeño en relación a las
otras bandas, la distancia euclidiana en un espacio multivariante puede ser tan pequeño que
varios clusters resultarán en un valor medio de cero. Si uno de los clusters tiene un valor medio
de cero, la clasificación final y cualquier otra herramienta multivariante que depende de un
archivo de firma fallará. Sería ideal que todas las bandas se normalicen al mismo rango de
valor.
Para realizar una clasificación no supervisada en QGIS busque la herramienta K-means

Clustering for Grids:
En el videotutorial se muestra el procedimiento previa extracción de las bandas que nos
interesan (4, 5 y 6) mediante la calculadora raster de QGIS, pero resultaría igualmente válido
escogiendo la imagen multibanda.
Seguidamente, seleccione los siguientes parámetros. Puede optar por 3 métodos distintos de
agrupamiento o Clustering. Escoja en este caso el mixto (Combined Minimum
Distance/Hillclimbing) que se muestra en el videotutorial, pero siempre es conveniente
comparar resultados y escoger el que le proporcione un mejor resultado, en función de las
distintas clases o agrupaciones generadas.
Analice el resultado y compárelo con la clasificación supervisada:
Productos informativos a entregar: Deberá entregar dos capturas de pantalla; una clasificación
supervisada y una no supervisada de 5 clases en ambos casos, de cualquier sector de su área
de estudio a escala 1:7000, debemos de garantizar que la escala sea lo más optima posible

Clasificaciones Supervisada y No Supervisadas

Cargado por

Copyright:

Formatos disponibles

Clasificaciones Supervisada y No Supervisadas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clasificaciones Supervisada y No Supervisadas

Cargado por

Copyright:

Formatos disponibles

Se concede permiso para copiar, distribuir o modificar esta obra bajo los términos expresados

En teledetección el conjunto de variables está compuesto por la reflectividad en cada una de

La incorporación de información textural y contextual tiene, sin embargo, el inconveniente de

La determinación de las clases puede hacerse básicamente mediante dos criterios:

• No estadísticos (árboles de decisión, mínima distancia, paralelepípedos)

• Estadísticos clásicos (máxima probabilidad)

• Algoritmos basados en inteligencia artificial (lógica borrosa, redes neuronales)

• Algoritmos que utilizan información contextual

Clasificación Supervisada con Semiautomatic Classification en

Las clases que se van a crear pueden ser:

- Vivienda o residencial combinables

Seguidamente puede generar una macroclase urbana, con la subcategoría “Vivienda”:

Después, en la barra de herramientas SCP seleccione “Crear un ROI de polígono”

Después de seleccionar cada categoría, pulse “Guardar el ROI temporal en el Entrenamiento de

Para las infraestructuras de comunicación (carreteras) se podría escoger la opción “Activar el

Otra sería “Bosque”

Otra herramienta útil a la hora de interpretar el comportamiento reflectivo de las diferentes

En realidad, a la hora de aplicar una clasificación, existen múltiples algoritmos de

Distancia mínima Máxima probabilidad Ángulo espectral

Evidentemente el pixel X se asignará a la clase respecto a la cual su distancia sea mínima. En

Clasificación por ángulo espectral

Se trata de un algoritmo sencillo basado en la medida de la similitud espectral entre dos

La herramienta devuelve un archivo de firma que contiene estadísticas multivariantes para un

 Z es el raster de salida con las nuevas clases.

Se calcula la distancia desde cada punto al punto central medio.

 Se grafica el siguiente punto de muestra y se repite el procedimiento anterior para todos

Se calcula la distancia para todos los puntos de muestra.

Se calculan los nuevos puntos centrales medios para cada clase.

 Se actualizan los valores medios, y se repite el paso anterior. El proceso de iteración

Para realizar una clasificación no supervisada en QGIS busque la herramienta K-means

Analice el resultado y compárelo con la clasificación supervisada:

También podría gustarte