Qué Es La Minería de Datos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

1. ¿Qué es la minería de datos?

(Data mining)

Los mineros o exploradores de datos, intentan descubrir patrones en


enormes volúmenes de datos. Los métodos utilizados de estos nuevos
profesionales son la inteligencia artificial, el aprendizaje automático, la
estadística y sistemas de base de datos.

La minería de datos es el conjunto de técnicas y tecnologías que


permiten explorar grandes bases de datos con el objetivo de encontrar
patrones que nos puedan aportar información valiosa en la toma de futuras
decisiones. El proceso de minería de datos tiene normalmente cuatro etapas
principales:

- Determinación de los objetivos


- Procesamiento de los datos
- Determinación del modelo
- Análisis de los resultados

En el primero de los pasos se trata el tipo de información que el cliente desea


extraer de la base de datos. La segunda etapa es la que requiere más trabajo
ya que se tiene de seleccionar, limpiar, enriquecer, reducir y transformar la
base de datos que nos ha facilitado el cliente. Una vez la hemos procesado y
está lista para implementarle el algoritmo de inteligencia artificial, tenemos
que escoger qué algoritmo nos va a dar mejores resultados.

La elección del mejor algoritmo para una tarea analítica específica es un gran
desafío y depende del problema a resolver. Hay básicamente cinco problemas
diferentes en la minería de datos: clasificación, regresión, segmentación,
asociación y análisis de secuencias.

Para resolver estos problemas hay muchos algoritmos a utilizar, los


principales son: los de asociación, los clústeres, los de árbol de decisión, los de
regresión lineal, el clasificador Bayesiano ingenuo, los de red neuronal, los
clústeres de secuencia y los de serie temporal.

Finalmente, el último paso es el de análisis de los resultados. Actualmente


este trabajo se está realizando en muchas áreas de negocio como seguridad
de datos, finanzas, salud, marketing, detección de fraude, búsquedas online,
procesamiento de lenguaje natural o los nuevos coches inteligentes.

Por estas razones la minería de datos se está convirtiendo en uno de los


trabajos con mayor proyección para el futuro, ya que ahorra grandes
cantidades de dinero para las empresas y abre nuevas oportunidades de
negocio.

Ventajas

El Data Mining descubre información que no se esperaba obtener.


Como muchos modelos diferentes son validados, algunos resultados
inesperados tienden a aparecer. En muchos estudios, se ha descubierto que
combinaciones particulares de factores entregan efectos inesperados que
entregan valor a la compañía.(Pañales y cerveza)

Los Modelos Son Confiables


El modelo es probado y comprobado usando técnicas estadísticas antes de
ser usado, luego las predicciones que se obtienen por el modelo son válidas y
confiables.

Los modelos se construyen de manera rápida.


La minería de datos permite construir y generar modelos en sólo uno minutos
u horas. El modelado se torna mucho más fácil puesto que muchos algoritmos
son probados y sólo el mejor modelo es entregado al usuario.

Desventajas

Dificultad de recopilación de los datos


Dependiendo del tipo de datos que se quieran recopilar puede conllevar
mucho trabajo o la necesidad de tecnología de elevado coste.

El pre procesamiento de datos puede llevar demasiado tiempo


No está asegurada la obtención de un modelo válido

2. Machine Learning

El machine learning es un método de análisis de datos que automatiza la


construcción de modelos analíticos. Es una rama de la inteligencia
artificial basada en la idea de que los sistemas pueden aprender de datos,
identificar patrones y tomar decisiones con mínima intervención humana.
3. Big Data

Big data es un término que describe el gran volumen de datos – estructurados


y no estructurados – que inundan una empresa todos los días. Pero no es la
cantidad de datos lo importante. Lo que importa es lo que las organizaciones
hacen con los datos. El big data puede ser analizado para obtener insights que
conlleven a mejores decisiones y acciones de negocios estratégicas.
Definiciones individuales de todos los términos:

Data Science es un campo que abarca todo lo relacionado con la limpieza,


preparación y análisis de datos. Es un estudio para predecir el futuro basado
en patrones pasados. Implica estimar lo desconocido mientras genera sus
propias preguntas.

El análisis de datos es descubrir percepciones significativas de los


datos. Implica mirar lo conocido desde nuevas perspectivas y encontrar
respuestas a un conjunto dado de preguntas a partir de datos.

El aprendizaje automático es aprender algunas tareas de la experiencia


pasada para mejorar el rendimiento. Implica el estudio de algoritmos que
pueden extraer información automáticamente.

La minería de datos es un área que ha tomado gran parte de su inspiración y


técnicas del aprendizaje automático. Lo lleva a cabo una persona, en una
situación específica, en un conjunto de datos particular, con un objetivo en
mente. Por lo general, el objetivo es descubrir o generar algunas ideas
preliminares en un área donde realmente solo había un pequeño
conocimiento de antemano, o ser capaz de predecir observaciones futuras
con precisión. Las técnicas comunes de minería de datos incluirían análisis de
conglomerados, árboles de clasificación y regresión y redes neuronales.

La inteligencia artificial es el estudio de cómo crear agentes inteligentes. En la


práctica, es cómo programar una computadora para que se comporte y
realice una tarea como agente inteligente.

Big data son activos de información de gran volumen y alta velocidad y / o


gran variedad que exigen formas rentables e innovadoras de procesamiento
de información que permitan una mejor comprensión, toma de decisiones y
automatización de procesos. El análisis de Big Data encuentra información
que ayuda a las organizaciones a tomar mejores decisiones comerciales.

También podría gustarte