Ecosistema Hadoop v1
Ecosistema Hadoop v1
Ecosistema Hadoop v1
desde el celular hasta en la oficina, pues siempre están presentes para tomar la mejor decisión
según se necesite. Los datos vienen acompañados de grandes herramientas como el famoso Big
Data compuesto por las cinco V´s (volumen, velocidad, variedad, veracidad y valor) y una de las
problemática para indexar la web y propuso una solución basada en un sistema de ficheros (GFS)
datos como la capacidad de gestionar datos de diferentes tipos, un entorno compartido como la
capacidad de gestionar múltiples tareas de forma simultánea y su objetivo final es aportar valor
siguiente imagen:
Ambari: facilita la gestión con una interfaz intuitiva y proporciona una API basada en REST
URLs.
HBase: base de datos de Hadoop, útil para escrituras y lecturas en tiempo real y acceso aleatorio
de los datos.
Hive: sistema de Data Warehouse para la consulta de datos con un lenguaje llamado HiveQL,
similar al SQL.
Pig: permite focalizar en el análisis de datos, sin tener que centrarse en la creación de
data minig.
Lucene: librería para buscar textos planos y encontrarlos mediante cualquier criterio de
búsqueda.
Avro: sistema de serialización de datos para procesarlos y almacenarlos con el fin de leerlos
Flume: sistema distribuido que simplifica el proceso de recolectar los datos para poder
Herramientas GIS: facilita el trabajo en clústers con mapas geográficos para su mejor
Spark: sistema que procesa los datos a una velocidad superior a MapReduce en tiempo real y