Pia Almacenes de Datos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

FACULTAD DE CONTADURÍA PÚBLICA Y ADMINISTRACIÓN


TECNOLOGÍAS DE LA INFORMACIÓN

PIA CUESTIONARIO 3ERAS


ALMACENES DE DATOS NO ESTRUCTURADOS.

Lorena Guerrero Arreola #2009950


CUESTIONARIO
ALMACENES DE DATOS NO ESTRUCTURADOS

1. ¿cuánto equivale 8 bits?


• Equivale 1 byte
2. ¿Qué son los datos no estructurados?

• Es un conjunto de datos que no se almacenan en un formato de base


de datos no estructurado como, imágenes, audio, datos de sensor,
datos de texto etc.
3. ¿son los datos que se pueden pensar como registros o transacciones
en un entorno de base de datos?
• Los datos estructurados
4. ¿Se pueden pensar como datos que no se gestionan de forma activa en
un sistema transaccional?
• Los datos no estructurados
5. ¿Cuáles son los datos no estructurados?
• Los correos electrónicos, mensajes de texto, búsquedas de internet,
imágenes, comunicaciones en las redes sociales, etc.,
6. ¿Como está compuesto un sistema distribuido?
• Este compuesto por N maquinas, dependiendo de la necesidad de las
aplicaciones que vayan a ejecutarse.

7. ¿Cuál es la característica de los sistemas distribuidos?


• Son nodos independientes que están intercomunicados por la misma
red, de tal manera que, aunque cada maquina tiene su sistema
operativo.
8. ¿Facilita el almacenamiento y obtención de datos de una organización?
• Data Lake
9. ¿Se le denomina Datos en crudo?
• Landing, es donde se llenan los datos tal cual los obtenemos de la
fuente de origen.
10. ¿Es cuando llevamos los datos de Landing a Staging?
• Cuando los datos los operamos y los procesamos.
11. ¿Puede un dato llegar a la zona Landing y automáticamente con un
procesador, pasar a la zona Gold?
• Por supuesto, no hay ningún tipo de restricción.
12. ¿Es la calidad que pasa por la zona Landing, lo limpiamos,
preparamos, etc., y lo dejamos en la zona Stating, y luego lo
preparamos para que tenga calidad?
• Zona Gold
13. ¿Qué significa Big data?
• Es un conjunto de tecnologías que permiten la recopilación,
almacenamiento, gestión, análisis y visualización, potencialmente en
condiciones de tiempo real.
14. ¿Cuáles son las 5v?
• Velocidad, Volumen, Variedad, Veracidad y Valor.
15. ¿Se refiere al gran volumen de información que se maneja?
• Volumen
16. ¿Es la enorme velocidad en la generación, recogida y proceso de la
información?
• Velocidad
17. ¿Necesidad de agregar información procedente de una amplia
variedad de fuentes de información?
• Variedad
18. ¿Es la creación de una ventaja competitiva al identificar y procesar
los datos claves, permitiendo monetizar datos, generar fidelidad, etc.?
• Valor
19. ¿Se debe analizar inteligentemente un gran volumen de datos con la
finalidad de obtener una información verídica y útil?
• Veracidad
20. ¿Se le denomina inteligencia de negocio?
• La diciplina que estudia la aplicación de las TIC para la mejora y
automatización de los procesos de la toma decisiones.
21. ¿Cuáles son los tipos de datos que contiene el Big data?
• Web y redes sociales, entre maquinas, transacciones, biométricos,
personas.
22. ¿Qué es el Business Intelligence?
• Es un termino de se utiliza para referirse al uso de la información
existente en los procesos y actividades de una empresa de cara a la
toma de decisiones de manera más informada.
23. ¿cuáles son las ventajas de BI?
• Análisis de sentención, mejora de productos, reacción frenge a la
competencia.
24. ¿Qué es una Fuente de datos?
• Es un punto de abastecimiento de datos con la información
potencialmente útil para el análisis de un proceso de negocio de nuestra
organización.
25. ¿Que son los datos semiestructurados?
• El procesamiento de información estrucutrada es el mas sencillo, y,
desde hace tiempo, se consigue realizar de forma eficiente para
grandes volúmenes de datos.
26. ¿Cuáles son los formatos semi estructurados más usados?
• XML, JSON, CSV, EXCEL.
27. ¿Suelen contener metadatos?
• Los datos semiestructurados.
28. ¿no tienen una estructura definida de forma explícita?
• Datos No estructurados.
29. ¿Qué es el open data?
• Iniciativa liderada por la administración del gobierno de los Estados
Unidos y en paralelo por la Unidad Europea.
30. ¿Que son los datos abiertos?
• Son datos que pueden se utilizados, reutilizados y distribuidos
libremente por cualquier persona y que se encuentren sujetos.
31. Qué es el open government Data?
• Datos que produce el gobierno en el desarrollo de sus funciones con
recursos públicos y por ende están a disponibilidad del publico.
32. ¿Cuál es la estrella número 2 de los Datos abiertos?
• Estructurados
33. ¿Cuál es la estrella número 5 de los Datos abiertos?
• Estructurados + formatos no propietarios+ URL única y estática+
interconectados con otras bases de datos.
34. ¿Cuál es la estrella número 3 de los Datos abiertos?
• Estructurados + formatos no propietarios.
35. ¿Cuál es la estrella número 1 de los Datos abiertos?
• No estructurados.
36. ¿Cuál es la estrella número 4 de los Datos abiertos?
37. Estructurados + formatos no propietarios+ URL única y estática.
38. ¿Permite orientar el problema y poner en valor los modelos?
• Componente del negocio.
39. ¿Tiene como posibilidad el procesamiento de grandes volúmenes de
información?
• Componente Tecnológico.
40. ¿Los modelos se construyen aplicando el método científico sobre los
datos?
• Componente científico.
41. ¿Es clave para transmitir todos los datos de manera clara y
sintetizada?
• Componente comunicativa.
42. ¿El objetivo de esta fase es identificar, analizar y comprender el
problema y traducirlo a un problema analítico?
• Comprensión del Negocio.
43. ¿Qué es el análisis descriptivo?
• Mostrar mediante estadísticos la realidad capturada.
44. ¿Qué es en análisis inferencial?
• Generalizar conclusiones muestrales a toda población, estudiar las
relaciones entre variables y contrastar hipótesis.
45. ¿El objetivo es capturar, almacenar y preparar la información?
• Tratamiento de Datos.
46. ¿El objetivo es construir un tablón único de datos con toda la
información disponible que este preparado para el modelado?
• Fusión.
47. ¿El objetivo de esta fase es construir un modelo analítico a partir del
tablón de datos que ya tenemos generado?
• Modelización.
48. ¿Asegura la capacidad analítica y evita el overfitting?
• Entrenamiento del modelo: División.
49. ¿Se entrenan los modelos con el conjunto de entrenamiento?
• Entrenamiento del modelo: Estimación.
50. ¿Se selecciona el modelo con el conjunto de validación?
• Entrenamiento del modelo: Selección
51. ¿La capacidad analítica se calcula en el conjunto de test?
• Evaluación del Modelo.

También podría gustarte