Introduccion Analitica de Datos
Introduccion Analitica de Datos
Introduccion Analitica de Datos
PROCESO
● BIG DATA
Definición.
“Big Data es un término que describe el gran volumen de datos, tanto estructurados
como no estructurados, que inundan los negocios cada día. Pero no es la cantidad de
datos lo que es importante. Lo que importa con el Big Data es lo que las
organizaciones hacen con los datos. Big Data se puede analizar para obtener ideas
que conduzcan a mejores decisiones y movimientos de negocios estratégicos.
Es el conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño
(volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan
su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas
convencionales, tales como bases de datos relacionales y estadísticas
convencionales o paquetes de visualización, dentro del tiempo necesario para que
sean útiles.
En la mayoría de los casos, con el fin de utilizar eficazmente el Big Data, debe
combinarse con datos estructurados (normalmente de una base de datos relacional)
de una aplicación comercial más convencional, como un ERP (Enterprise Resource
Planning) o un CRM (Customer Relationship Management).”
Fuente: https://www.powerdata.es/big-data
“Turismo: mantener felices a los clientes es clave para la industria del turismo, pero
la satisfacción del cliente puede ser difícil de medir, especialmente en el momento
oportuno. Resorts y casinos, por ejemplo, sólo tienen una pequeña oportunidad de dar
la vuelta a una mala experiencia de cliente. El análisis de Big data ofrece a estas
empresas la capacidad de recopilar datos de los clientes, aplicar análisis e identificar
inmediatamente posibles problemas antes de que sea demasiado tarde.
Otros ejemplos del uso efectivo de Big Data existen en las siguientes áreas:
“Las especiales características del Big Data hacen que su calidad de datos se enfrente
a múltiples desafíos. Se trata de las conocidas como 5 Vs: Volumen, Velocidad,
Variedad, Veracidad y Valor, que definen la problemática del Big Data.
Fuente: www.pragma.com.co
Estas 5 características del big data provocan que las empresas tengan problemas
para extraer datos reales y de alta calidad, de conjuntos de datos tan masivos,
cambiantes y complicados.
Hasta la llegada del Big Data, mediante ETL podíamos cargar la información
estructurada que teníamos almacenada en nuestro sistema ERP y CRM, por ejemplo.
Pero ahora, podemos cargar información adicional que ya no se encuentra dentro de
los dominios de la empresa: comentarios o likes en redes sociales, resultados de
campañas de marketing, datos estadísticos de terceros, etc. Todos estos datos nos
ofrecen información que nos ayuda a saber si nuestros productos o servicios están
funcionando bien o por el contrario están teniendo problemas.”
Fuente: https://www.powerdata.es/big-data
Con base en lo anterior sobresalen los siguientes desafíos del Big Data:
● DATA MINING
https://unayta.es/data-mining-big-data
Son muchas las herramientas que se han ido generando a medida de que la analítica
de datos ha tomado fuerza por su aplicabilidad y ayuda en las empresas, algunas de
las más destacadas son:
Microsoft Power BI: “herramienta analítica de Microsoft y una de las más populares,
ya que ofrece visualizaciones interactivas de datos, así como una integración sencilla
con otras herramientas de la corporación. Además, Power BI puede integrarse en
aplicaciones de terceros mediante Power BI Embedded y permite compartir reportes
y análisis de datos de forma muy segura. Puede conectarse con más de 60 fuentes
de datos, como Spark, Hadoop o SAP y es fácil de utilizar incluso para usuarios sin
conocimientos técnicos.
Excel: una de las herramientas más populares en las empresas, se puede decir que
su uso es fundamental en el trabajo diario de las organizaciones de diferentes sectores
del mercado, lo cual se dá por su versatilidad, porque juega un papel muy importante
en el análisis de datos internos de los clientes. Si bien, es una herramienta básica, su
opción avanzada de business analytic con sus diferentes opciones permiten que la
herramienta pueda realizar importantes modelados de datos.
Tableau Public: “es un software gratuito que conecta diferentes fuentes de datos,
como Microsoft Excel, Data Warehouse, datos basados en la web, etc. y crea
dashboards, mapas y visualizaciones que tienen actualizaciones en tiempo real desde
la web. También puedes compartirlos con un cliente o a través de los medios sociales.
Una vez que tienes acceso, puedes descargar diferentes formatos para un archivo.
Para disfrutar típicamente de esta herramienta y ver su poder, tu fuente de datos debe
ser muy buena. La capacidad de Big Data de esta herramienta la hace importante y el
hecho de que puedas analizar y visualizar los datos mucho mejor que otros programas
de visualización de datos les da una ventaja.”
Fuente: https://blog.bismart.com/es/9-mejores-herramientas-analisis-datos
Rapid Miner: “Esta es una potente herramienta para el data science integrado. Fue
desarrollada por una compañía que también realiza análisis predictivos y algunos
análisis más avanzados como machine learning, análisis de texto, análisis visual y
minería de datos sin necesidad de programación. Esta herramienta puede
incorporarse a cualquier tipo de fuente de datos, incluyendo Excel, Oracle, IBM SPSS,
Teradata, Access, Microsoft SQL, Dbase, Sybase, etc. Esta herramienta es capaz de
generar análisis tomando como base los ajustes de transformación de los datos de la
vida real, lo que significa que puede controlar los conjuntos de datos y los formatos
para el análisis predictivo.”
Fuente: https://blog.bismart.com/es/9-mejores-herramientas-analisis-datos
Qlik View: “tiene una serie de características únicas, algunas de las cuales son el
procesamiento de datos en memoria y la tecnología patentada para ayudarle a
ejecutar su resultado rápidamente y almacenar todos los datos que están presentes
en el informe. Esta herramienta mantiene automáticamente la asociación de datos y
puede comprimirlos a sólo el 10% del tamaño inicial. Visualiza la relación de los datos
con los colores, con un color dado a los datos relacionados y otro a los datos no
relacionados.
Fuente: https://blog.bismart.com/es/9-mejores-herramientas-analisis-datos
Video recomendado.
Autor: ComputerHoy.com
CIBERGRAFÍA
● https://www.powerdata.es/big-data
● www.pragma.com
● https://www.master-data-scientist.com/que-es-data-mining/