¡Te damos la bienvenida a Scribd!

0% encontró este documento útil (0 votos)

33 vistas

Ecosistema Hadoop v1

Cargado por

herramienta de IBM que permite crear asistentes virtuales conversacionales mediante técnicas de procesamiento de lenguaje natural.

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Ecosistema Hadoop v1

Cargado por

Diana Zarate F

0% encontró este documento útil (0 votos)

33 vistas3 páginas

herramienta de IBM que permite crear asistentes virtuales conversacionales mediante técnicas de procesamiento de lenguaje natural.

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

herramienta de IBM que permite crear asistentes virtuales conversacionales mediante técnicas de procesamiento de lenguaje natural.

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Descargar como docx, pdf o txt

0% encontró este documento útil (0 votos)

33 vistas3 páginas

Ecosistema Hadoop v1

Cargado por

Diana Zarate F

herramienta de IBM que permite crear asistentes virtuales conversacionales mediante técnicas de procesamiento de lenguaje natural.

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Descargar como docx, pdf o txt

Saltar a página

Está en la página 1de 3

Buscar dentro del documento

Desde hace algunos años, los datos en grandes volúmenes nos han estado acompañando

desde el celular hasta en la oficina, pues siempre están presentes para tomar la mejor decisión

según se necesite. Los datos vienen acompañados de grandes herramientas como el famoso Big

Data compuesto por las cinco V´s (volumen, velocidad, variedad, veracidad y valor) y una de las

mejores herramientas y más utilizadas es Hadoop.

Años atrás, exactamente en el 2004 Google publicó un artículo describiendo la

problemática para indexar la web y propuso una solución basada en un sistema de ficheros (GFS)

en un modelo de programación MapReduce y Doug Cutting vió el potencial de la solución y en

el 2005 Yahoo lanzó una implementación llamada Hadoop.

Hadoop es desarrollado y mantenido por The Apache Software Foundation y tiene

algunos objetivos como la escalabilidad como la capacidad de almacenar grandes volúmenes de

datos, la tolerancia a fallos como la capacidad de recuperarse de errores de software, tipos de

datos como la capacidad de gestionar datos de diferentes tipos, un entorno compartido como la

capacidad de gestionar múltiples tareas de forma simultánea y su objetivo final es aportar valor

para la extracción de los datos.

Hadoop es un ecosistema que incluye un conjunto de herramientas y aplicaciones para

alcanzar sus objetivos (nombrados anteriormente). Sus aplicaciones se pueden organizar en un

diagrama de capas que representan distintas interfaces, desde el almacenamiento a lenguajes de

alto nivel. Hadoop no es un proyecto Opensource independiente. Es más bien un complejo

ecosistema de proyectos muy diversos que trabajan a la par. Su Ecosistema se encuentra en la

siguiente imagen:
Ambari: facilita la gestión con una interfaz intuitiva y proporciona una API basada en REST

para desarrolladores, librería de funciones a la que se accede a través de direcciones web o

URLs.

HBase: base de datos de Hadoop, útil para escrituras y lecturas en tiempo real y acceso aleatorio

de los datos.

Hive: sistema de Data Warehouse para la consulta de datos con un lenguaje llamado HiveQL,

similar al SQL.

Sqoop: herramienta para estraer datos de sistemas de almacenamiento estructurado e importarlos

para su posterior procesamiento.

Pig: permite focalizar en el análisis de datos, sin tener que centrarse en la creación de

programas. Desarrolado inicialmente por Yahoo.

ZooKeeper: servicio de coordinación de alto rendimiento con infraestructura centralizada que

ofrece servicios como sincronización o naming, con una interfaz simple.

NoSQL: almacenes de datos que facilita la gestión y análsisis de datos no estructurados, y

dispone de herramientas como DataStax como Monto DB.

Mahout: librería de software que construye bibliotecas escalables de aprendizaje automático y

data minig.

Lucene: librería para buscar textos planos y encontrarlos mediante cualquier criterio de

búsqueda.

Avro: sistema de serialización de datos para procesarlos y almacenarlos con el fin de leerlos

fácilmente desde distintos lenguajes de programación.

Flume: sistema distribuido que simplifica el proceso de recolectar los datos para poder

almacenarlos en Hadoop, analizarlos, moviéndolos hasta un repositorio central.

Herramientas GIS: facilita el trabajo en clústers con mapas geográficos para su mejor

comprensión a la hora de su ejecución en Hadoop.

Spark: sistema que procesa los datos a una velocidad superior a MapReduce en tiempo real y

también puede implementarse de forma independiente.

También podría gustarte

Como Programar en Java (9na Ed.) - DeITEL
Documento618 páginas
Como Programar en Java (9na Ed.) - DeITEL
Fercho conto
80% (5)
Apache Hadoop
Documento14 páginas
Apache Hadoop
Mauricio Alberto Arce Bolados
0% (1)
Resumen
Documento4 páginas
Resumen
alex hepburn
Aún no hay calificaciones
Investigacion
Documento7 páginas
Investigacion
matzhu14
Aún no hay calificaciones
Big Data Con Hadoop
Documento10 páginas
Big Data Con Hadoop
Lexx Skyfall
Aún no hay calificaciones
Las Herramientas de Big Data
Documento5 páginas
Las Herramientas de Big Data
MiguelLopez
Aún no hay calificaciones
Trabajo Grupal Industria 4.0
Documento9 páginas
Trabajo Grupal Industria 4.0
Cinthia Bautista Ramirez
Aún no hay calificaciones
Spark para Dummies
Documento6 páginas
Spark para Dummies
jesusdaa1
Aún no hay calificaciones
CD - M8 AE1 Contenidos - 2023
Documento12 páginas
CD - M8 AE1 Contenidos - 2023
li_sisay
Aún no hay calificaciones
Estrategias para La Migración de Bases de Datos
Documento34 páginas
Estrategias para La Migración de Bases de Datos
Leticia Gómez
Aún no hay calificaciones
Qué Es Hadoop
Documento3 páginas
Qué Es Hadoop
luis Alberto ruiz asto
Aún no hay calificaciones
Sqoop
Documento2 páginas
Sqoop
eduardo28zavala
Aún no hay calificaciones
Big Data Tech
Documento8 páginas
Big Data Tech
jagp
Aún no hay calificaciones
Apache Hadoop: Introducción 2024 - Aprender BIG DATA
Documento1 página
Apache Hadoop: Introducción 2024 - Aprender BIG DATA
pfidalgo
Aún no hay calificaciones
Herramientas Del Big Data
Documento3 páginas
Herramientas Del Big Data
Jeferson Bello
Aún no hay calificaciones
Agdsftema2 Tarea2
Documento8 páginas
Agdsftema2 Tarea2
Antonio Gabriel Leiva
Aún no hay calificaciones
35 Motores de Bases de Datos Open Source
Documento6 páginas
35 Motores de Bases de Datos Open Source
MadaraUchiha Rua Huam
Aún no hay calificaciones
Introducción a Apache Hadoop
Documento26 páginas
Introducción a Apache Hadoop
rafa.mellado.g
Aún no hay calificaciones
Big Data
Documento27 páginas
Big Data
Katia Manjarrez
Aún no hay calificaciones
01 Hadoop A
Documento36 páginas
01 Hadoop A
RONALD NICOLAS SAENZ CHUQUI
Aún no hay calificaciones
Ensayo Hadoop y Spark
Documento4 páginas
Ensayo Hadoop y Spark
Karen Jazmín Jiménez Rodríguez
Aún no hay calificaciones
M4 U1 Ecosistema Hadoop
Documento29 páginas
M4 U1 Ecosistema Hadoop
Agustina Carla Lentini
Aún no hay calificaciones
BIGDATA
Documento26 páginas
BIGDATA
nokiaverde23
Aún no hay calificaciones
1 - Hadoop v2
Documento41 páginas
1 - Hadoop v2
LUCY SAMAYRA LUCY SAMAYRA MENDEZ/SANTIAGO
Aún no hay calificaciones
Curso Big Data (Tema 1)
Documento32 páginas
Curso Big Data (Tema 1)
CORAL ALONSO JIMÉNEZ
Aún no hay calificaciones
Glosario de Terminos
Documento3 páginas
Glosario de Terminos
Rodolfo Enrique Codoceo Veas
Aún no hay calificaciones
big data 3
Documento18 páginas
big data 3
fotosg719
Aún no hay calificaciones
Resumen Herramientas de Código Abierto para La Ciencia de Datos
Documento2 páginas
Resumen Herramientas de Código Abierto para La Ciencia de Datos
Pan Amasado
Aún no hay calificaciones
Arquitectura de La Información
Documento18 páginas
Arquitectura de La Información
javier
Aún no hay calificaciones
Separata 02
Documento16 páginas
Separata 02
Joaquín Alvarado
Aún no hay calificaciones
Agdsftema2 Tarea2
Documento8 páginas
Agdsftema2 Tarea2
Antonio Gabriel Leiva
Aún no hay calificaciones
18-Big Data
Documento3 páginas
18-Big Data
miasitik
Aún no hay calificaciones
Ensayo Hadoop
Documento6 páginas
Ensayo Hadoop
ARVEY RODRIGUEZ GONZALEZ
Aún no hay calificaciones
Igbd - Equipo 11
Documento11 páginas
Igbd - Equipo 11
Lalo Reyes
Aún no hay calificaciones
Copia de Grupo 4 Original
Documento15 páginas
Copia de Grupo 4 Original
Heidi Isabella Sanchez
Aún no hay calificaciones
Herramientas Inteligencia Artificial
Documento3 páginas
Herramientas Inteligencia Artificial
nancy camelo
Aún no hay calificaciones
HIVE
Documento1 página
HIVE
paolagarcia1107
Aún no hay calificaciones
Resumen Del Libro MySQL - Introducción
Documento4 páginas
Resumen Del Libro MySQL - Introducción
cassianohc
Aún no hay calificaciones
subtitle (4)
Documento2 páginas
subtitle (4)
dalalsayeh83
Aún no hay calificaciones
Base de Datos
Documento12 páginas
Base de Datos
Cifuentes León Belinda
Aún no hay calificaciones
Examen BIG
Documento6 páginas
Examen BIG
jan carlo hernandez reyes
Aún no hay calificaciones
Herramientas Big Data
Documento31 páginas
Herramientas Big Data
Daniel Parra
Aún no hay calificaciones
Diferentes Motores de Bases de Datos
Documento11 páginas
Diferentes Motores de Bases de Datos
pruebakevin123
50% (2)
Bases de Datos NoSQL
Documento25 páginas
Bases de Datos NoSQL
Kevin Gustavo
Aún no hay calificaciones
1. Ecosistema Hadoop
Documento19 páginas
1. Ecosistema Hadoop
Luis Angel Alfonso Zamora
Aún no hay calificaciones
Trabajo INV07-Mendez Cartolin Johanna Liseth
Documento4 páginas
Trabajo INV07-Mendez Cartolin Johanna Liseth
Johannaxdxd
Aún no hay calificaciones
Conceptos PWA
Documento8 páginas
Conceptos PWA
Andrws Guri
Aún no hay calificaciones
Lectura 03 - Admon TI
Documento7 páginas
Lectura 03 - Admon TI
infodepagt
Aún no hay calificaciones
Album GDBT
Documento9 páginas
Album GDBT
Isaac Chávez
Aún no hay calificaciones
Implementaciones
Documento6 páginas
Implementaciones
Jairo Alvarez
Aún no hay calificaciones
00 Presentación 2
Documento33 páginas
00 Presentación 2
Delfor Chacón
Aún no hay calificaciones
BD NOSQL y Memoria - Cap6
Documento34 páginas
BD NOSQL y Memoria - Cap6
norma
Aún no hay calificaciones
Tarea DDL DML Hana
Documento1 página
Tarea DDL DML Hana
Julian David
Aún no hay calificaciones
Unidad 1 - Introduccion
Documento13 páginas
Unidad 1 - Introduccion
Ivana Galván
Aún no hay calificaciones
INTEGRANTES
Documento6 páginas
INTEGRANTES
Joel Guillen Iparraguirre
Aún no hay calificaciones
Introducciòn Al Big Data Con Apache Hadoop PDF
Documento8 páginas
Introducciòn Al Big Data Con Apache Hadoop PDF
Diego Ruiz
Aún no hay calificaciones
Unidad 4 Actividad 1
Documento6 páginas
Unidad 4 Actividad 1
Daniel Gonzalez Padilla
Aún no hay calificaciones
Nuevo Documento de Microsoft Word
Documento1 página
Nuevo Documento de Microsoft Word
Gerardo Hz H
Aún no hay calificaciones
6.1 Tecnologías
Documento9 páginas
6.1 Tecnologías
abel
Aún no hay calificaciones
DATABASE - Del modelo conceptual a la aplicación final en Access, Visual Basic, Pascal, Html y Php
De Everand
DATABASE - Del modelo conceptual a la aplicación final en Access, Visual Basic, Pascal, Html y Php
Olga Maria Stefania Cucaro
Aún no hay calificaciones
Las mejores herramientas online para escritores
De Everand
Las mejores herramientas online para escritores
Juanjo Ramos
Aún no hay calificaciones
Guía de Okr 2024
Documento44 páginas
Guía de Okr 2024
Diana Zarate F
100% (4)
Metricas para PM - Compressed
Documento11 páginas
Metricas para PM - Compressed
Diana Zarate F
Aún no hay calificaciones
Plantilla OKR University - Dashboard de OKR - 2023 2
Documento16 páginas
Plantilla OKR University - Dashboard de OKR - 2023 2
Diana Zarate F
Aún no hay calificaciones
Lista de Chequeo para Construccion de La Columna de Opinion
Documento2 páginas
Lista de Chequeo para Construccion de La Columna de Opinion
Diana Zarate F
Aún no hay calificaciones
Ensayo Kevin Mitnick
Documento8 páginas
Ensayo Kevin Mitnick
Diana Zarate F
Aún no hay calificaciones
Actividad Dos Jhon The Ripper
Documento12 páginas
Actividad Dos Jhon The Ripper
api-575220845
Aún no hay calificaciones
Guia SQL Lite Ionic
Documento15 páginas
Guia SQL Lite Ionic
Claribel Zabala Espinosa
Aún no hay calificaciones
Prog - Modular - Parte - 05 - Procedimientos
Documento19 páginas
Prog - Modular - Parte - 05 - Procedimientos
jhasrinmendoza
Aún no hay calificaciones
Herramientas Digitales
Documento11 páginas
Herramientas Digitales
cinthia
Aún no hay calificaciones
Creando Una Extensión de Chrome
Documento75 páginas
Creando Una Extensión de Chrome
ArrakisStudios
Aún no hay calificaciones
Estructuras de Control Repetitivas
Documento16 páginas
Estructuras de Control Repetitivas
prod. by curly
Aún no hay calificaciones
Actividad de Aprendizaje Poo Unidad 2
Documento6 páginas
Actividad de Aprendizaje Poo Unidad 2
juan manuel barreto diaz
Aún no hay calificaciones
02.crear Asesores Expertos Sin Programar
Documento17 páginas
02.crear Asesores Expertos Sin Programar
Enrique Blanco
Aún no hay calificaciones
Tarea 3 - Tecnologías, Arquitectura y Archivos de Big Data - Aldriana Burgos
Documento5 páginas
Tarea 3 - Tecnologías, Arquitectura y Archivos de Big Data - Aldriana Burgos
Katherine Sosa
Aún no hay calificaciones
T3 Operadores Expresiones y Sentencias 1718 v01
Documento115 páginas
T3 Operadores Expresiones y Sentencias 1718 v01
teresa alvarez alvarez
Aún no hay calificaciones
Practica 1 Taller de Programacion VB Net
Documento22 páginas
Practica 1 Taller de Programacion VB Net
Johny Cristian Mamani Contreras
Aún no hay calificaciones
Migracion BD
Documento1 página
Migracion BD
Pablo López
Aún no hay calificaciones
Certificación Virtual - Manual Del Participante
Documento8 páginas
Certificación Virtual - Manual Del Participante
dennysluis33
Aún no hay calificaciones
Codigo de C# para Registro
Documento10 páginas
Codigo de C# para Registro
pascual
Aún no hay calificaciones
Ensayo Sobre Las Aplicaciones de Google
Documento11 páginas
Ensayo Sobre Las Aplicaciones de Google
Eva Cristaldo Denis
Aún no hay calificaciones
CC2 Patrones Diseño
Documento19 páginas
CC2 Patrones Diseño
ANDREA DEL ROSARIO LOPEZ CONDORI
Aún no hay calificaciones
Copia de CLASE 2
Documento16 páginas
Copia de CLASE 2
EmericKill95
Aún no hay calificaciones
Colecciones 2
Documento22 páginas
Colecciones 2
Luis Figueroa
Aún no hay calificaciones
Acreditación de Responsables de Devengados en El Aeraf y Autorización de Devengados en El Madaf
Documento24 páginas
Acreditación de Responsables de Devengados en El Aeraf y Autorización de Devengados en El Madaf
Luis Cabanillas
Aún no hay calificaciones
Fundamentos de Informatica
Documento5 páginas
Fundamentos de Informatica
2015 Mat LOPEZ GAITAN GUSTAVO ANGEL
Aún no hay calificaciones
Certifica Do
Documento2 páginas
Certifica Do
Karen Aboytes
Aún no hay calificaciones
Prueba II Progra
Documento4 páginas
Prueba II Progra
Kevin Rodríguez
Aún no hay calificaciones
Ofimática Power Point
Documento5 páginas
Ofimática Power Point
Stiven Rafael Rodriguez Gutierrez
Aún no hay calificaciones
EVIDENCIA DIGITAL 3
Documento36 páginas
EVIDENCIA DIGITAL 3
Eduardo Maldonado Rosales
Aún no hay calificaciones
Mycellspy La Herramienta de Supervisión Perfecta
Documento3 páginas
Mycellspy La Herramienta de Supervisión Perfecta
Luis Onty
Aún no hay calificaciones
Tutorial Corona SDK
Documento145 páginas
Tutorial Corona SDK
Claudio Jose Castillo
100% (1)
Quiz Test Dwec
Documento3 páginas
Quiz Test Dwec
api-704952655
Aún no hay calificaciones
Manual Propio C# Prog I
Documento11 páginas
Manual Propio C# Prog I
Cuenta Cerrada
Aún no hay calificaciones
Text Class Review
Documento6 páginas
Text Class Review
Kiara Venegas
Aún no hay calificaciones