Mineria de Datos
Mineria de Datos
Mineria de Datos
Minera de datos
Seleccin del conjunto de datos: aqu se decide cules van a ser los variables objetivos
(aquellas que se quieren predecir o inferir), las variables independientes y la seleccin de
registros (datos) a utilizar.
Anlisis de las propiedades de los datos: mediante, por ejemplo, histogramas y/o
diagramas de dispersin. Bsqueda de valores atpicos (outliers) y ausencia de datos.
Transformacin o preprocesamiento del conjunto de datos de entrada: en ste paso, se
normalizan los datos a una misma escala. Tambin se decide cmo se van a tratar datos
faltantes, atpicos o dudosos. Una posibilidad es tratarlos como un tipo de dato especial o
bien se decide descartarlos.
Seleccin y aplicacin de tcnicas de minera de datos: se construye un modelo, el cual
ser utilizado sobre los datos para predecir las clases mediante clasificacin o para
descubrir grupos similares mediante segmentacin.
Extraccin de conocimiento: una vez aplicado el paso anterior, se buscan patrones de
comportamiento en los valores de las variables del problema o relaciones de asociacin
entre dichas variables.
Interpretacin y evaluacin de datos: el modelo debe ser validado comprobando que las
conclusiones arrojadas son vlidas y satisfactorias. Si el modelo final no supera sta
evaluacin, el proceso puede repetirse desde el principio o a partir de cualquiera de los
pasos anteriores.