Quiz 1

Quiz 1
Ciencia y tecnología
Docente: Oscar Hernán López
Presentado por:
Mendoza Duarte Julieth Ximena
Cod. 040100242017
CC. 1110602615
Universidad Del Tolima

Facultad De Ciencias Económicas Y Administrativas
Ibagué – Tolima
2020
1. A qué se refiere el término o concepto, tecnologías asociadas si las hay y, los elementos
esenciales que lo caracterizan. Para esto, deben bajar uno o varias paperas (artículos) y
referenciarlos.
Definición
Big Data, se reconoce como el conjunto de activos de información que se caracteriza por su alto
volumen, velocidad y variedad, y que demandan soluciones innovadoras y eficientes de
procesado para la mejora del conocimiento y la toma de decisiones (Fernández, Y. A., & Ferrer,
D. C.2016 (p.4)
El aumento desmesurado de datos y la información pública han contribuido al surgimiento de
nuevos paradigmas o herramientas; como el Big Data
Tecnologías asociadas
Como tecnologías de Big Data se clasifican aquellas que dan soporte a la captura,
transformación, procesamiento y análisis de los datos, ya sean estructurados, semiestructurados o
no estructurados
Se decide presentar estas tecnologías ya que son software de libre uso y que permite la
generación de soluciones de Big Data de acuerdo con las necesidades particulares de un dominio
de datos u organización.
 Hadoop: Es una librería de Apache definida como un framework que permite hacer
procesamiento de datos distribuido sobre volúmenes de datos de considerable tamaño sobre
clúster, El HDFS cuenta con tres pilares básicos. Namenode, se ocupa del control de acceso y
tiene la información sobre la distribución de datos en el resto de nodos. Datanodes, son los
encargados de ejecutar el cómputo, es decir, las funciones Map y Reduce, sobre los datos
almacenados de manera local en cada uno de dichos nodos. Jobtracker, este nodo se encarga
de las tareas y ejerce el control sobre la ejecución del proceso de MapReduce
Características
- Tolerancia a fallos
- Acceso a datos en streaming
- Facilidad para el trabajo
- Modelo sencillo de coherencia
- Portabilidad de convivencia
 MapReduce: es un modelo de programación que se ha asociado también a la implementación

de estrategias de procesamiento de grandes conjuntos de datos que puede ser aplicado a una
gran variedad de tareas del mundo real. El modelo se basa en los siguientes conceptos:
iteraciones sobre los datos de entrada, construcción de los pares clave-valor a partir de cada
pieza de entrada, agrupación de los valores intermedios de acuerdo con las claves, iteración
sobre los grupos resultantes y reducción de cada grupo
Características
- Distribución y paralelización automáticas
- Tolerancia a fallos y a redundancias
- Transparencia
- Escalabilidad horizontal
- Localización de los datos
- Herramientas de monitorización
 HBase Es una base de datos Hadoop, distribuida y escalable. HBase ha sido desarrollada por
Apache y se recomienda su uso cuando se necesita acceso a lectura y escritura de datos en
tiempo real sobre Big Data.
Características
- Escalabilidad modular y linear
- Estricta consistencia de lectura y
- escritura
- Facilidad de uso de la API de Java para
- el acceso de clientes
- Bloqueo de la caché para consultas en
- tiempo real
- Soporte de para exportar métricas a
- través del subsistema de métricas de
- Hadoop
 Cassandra: La base de datos Cassandra, propiedad de Apache, brinda escalabilidad y alta
disponibilidad sin comprometer el rendimiento. Se considera una plataforma ideal para tratar
problemas de datos críticos, puesto que cuenta con escalabilidad lineal y la tolerancia a fallos
en el hardware o en la infraestructura en la nube
- Tolerancia a fallos, por medio de la
- replicación automática de los datos en
- múltiples nodos
- Descentralización, uso de muchos nodos
- idénticos, sin cuellos de botella en la res
- Durable, diseñada para evitar la
- pérdida de datos
- Elasticidad, capacidad de añadir nuevas
- máquinas para aumentar el
- rendimiento de lectura y escritura
 Minería de Datos: La minería de datos (data mining - DM) se puede definir como el proceso
de extracción de conocimiento a partir de cúmulos de datos. Se suele utilizar el término
minería de datos como sinónimo de descubrimiento de conocimiento, pero realmente no son
sinónimos, la minería de datos es solo un paso en el proceso de descubrimiento de
conocimiento
Ítems que deben ser resueltos
2. Número de papers por año
El año en el que más documentos relacionados con Big Data y administración se publicaron
fue en el año 2020, la publicación de documentos relacionados con el tema va en aumento
3. ¿Desde qué año comienza la inserción del tema?

Podemos evidenciar que el tema de Big Data empezó a tener una inserción de documentos
relacionados para el 2000, pero su crecimiento se empezó a notar con más claridad para el año
2009
4. Los dos autores más representativos
Los dos Autores más representativos son

Gunasekaran con 48 Documento
Janssen con 47 Documentos
5. Los países que más han trabajado el tema

Se evidencia notablemente que el país que más a trabajado el tema es Estados Unidos con 23529
Documentos
6. las Instituciones que lo han trabajado
Harvard Medical Chol es una de las instituciones que más ha trabajado el tema con 601
Documentos
7. Las áreas de conocimiento más influyentes

El área de conocimientos que más trabaja los documentos relacionados con Big Data y
administración son las Ciencias sociales
8. ¿A qué conclusiones se puede llegar?
Big Data es un tema que está adquiriendo mayor fuerza y madurez al pasar el tiempo, Este
nos enseña las oportunidades y retos que contrae su estudio e implementación, entre estos esta
optimización y adaptación a diferentes dominios de datos.
Analizando los diferentes documentos podemos evidenciar que la utilización de la Big Data
nos brinda beneficios en los aspectos como la reducción de tiempos, optimización de recursos
y mayor flexibilidad.
El país que mas a trabajado el tema es Estados Unidos, seguido de Reino Unido, siento el
tema a trabajar Big Data y administración, las áreas de conocimiento que más influyeron son
las ciencias sociales y la medicina. Cabe aclara que este tema es trabajado por múltiples áreas,
pero estas fueron las de mayor influencia, Siendo trabajado principalmente por Harvard
Referencias bibliográficas
Fernández, Y. A., & Ferrer, D. C. (2016). Big Data: una herramienta para la administración
pública. Ciencias de la Información, 47(3), 3-8.
Hernández-Leal, E. J., Duque-Méndez, N. D., & Moreno-Cadavid, J. (2017). Big Data: una
exploración de investigaciones, tecnologías y casos de aplicación. Tecnológicas, 20(39), 17-24.
Scopus, https://www-scopus-com.bibliored.ut.edu.co/term/analyzer.uri?
sid=9d1de50adab2962df8580bdfde815753&origin=resultslist&src=s&s=ALL
%28big+data+and+administration%29&sort=plf-
f&sdt=b&sot=b&sl=32&count=60773&analyzeResults=Analyze+results&txGid=38b8616a56ef4
3038bd7a6c80e9cef29

Quiz 1

Cargado por

Copyright:

Formatos disponibles

Quiz 1

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Quiz 1

Cargado por

Copyright:

Formatos disponibles

Quiz 1

Docente: Oscar Hernán López

Universidad Del Tolima

 MapReduce: es un modelo de programación que se ha asociado también a la implementación

3. ¿Desde qué año comienza la inserción del tema?

Los dos Autores más representativos son

5. Los países que más han trabajado el tema

7. Las áreas de conocimiento más influyentes

También podría gustarte