Clustering Agrupamientos
Clustering Agrupamientos
Clustering Agrupamientos
Agrupamientos
Aprendizaje automático
Minería de Datos
• ¿Qué es ?
• Datawarehouse y Datamining
• Tools
– Clustering
Minería de Datos
• ¿Qué es?
– Consiste en la extracción no trivial de
información que reside de manera implícita en
los datos.(wikipedia)
• Algoritmos
• Ejemplo Practico
filas
columnas
Clustering Definiciones(1/2)
• Los algoritmos de clustering
permiten clasificar un conjunto de
elementos de muestra en un
determinado número de grupos
basándose en las semejanzas y
diferencias existentes entre los
componentes de la muestra.
Clustering Definiciones(2/2)
• Un algoritmo de agrupamiento (en inglés,
clustering) es un procedimiento de agrupación
de una serie de vectores según criterios
habitualmente de distancia; se tratará de
disponer los vectores de entrada de forma que
estén más cercanos aquellos que tengan
características comunes. Un algoritmo de
clustering permite extraer representantes de un
conjunto de datos, que pueden ser
posteriormente usados para transmisión, para
eliminación de ruido o con una fase posterior de
calibración, para clasificación de vectores en
diferentes conjuntos.
Algoritmos
• K-means
– Es probablemente el algoritmo de
agrupamiento más conocido.
1−clustering
5
2−clustering
1
3−clustering
4
2
4−clustering
3
5−clustering
1 2 3 4 5
Clustering-Ejemplo
http://www.lsi.us.es/~ndiaz/proyectosFinCarrera.html
http://www.elet.polimi.it/upload/matteucc/Clustering/tutorial_html/AppletKM.html
Clustering-Ejemplo
Un ejemplo practico
Datos para cada una de las 52 provincias.
Los datos son:
Nombre de la provincia
Población
Ratio varones/mujeres
Ratio extranjeros/españoles
Extensión de la provincia (en Km2)
Paro
Número de teléfonos fijos registrados
Número de vehículos de motor matriculados
Número de oficinas bancarias
Precio medio del m2 de vivienda