2.1 Modelo de Datos
2.1 Modelo de Datos
Los modelos de datos son sumamente necesarios cuando contamos con tablas con millones de
registros y en donde se requiere que los reportes estén lo más optimizado posible para cargar y
transformar los datos y lo usuarios puedan interactuar de la forma más fluida con la información
Modelo jerárquico: Este es un modelo de base de datos que se basa en una estructura en
forma de árbol. Aquí, cada uno de los registros tiene una única raíz o padre. Cuando se
trata de registros de hermanos, se ordenan en un orden particular. Este orden se utiliza
como orden físico para almacenar la base de datos. Puede utilizar este tipo de modelado
para muchas relaciones de modelos del mundo real. Durante las décadas de 1960 y 1970,
este modelo de base de datos estaba de moda. Pero debido a algunas ineficiencias, ahora
se utilizan muy raramente.
Modelo relacional: Esto fue propuesto inicialmente como una alternativa al modelo
jerárquico en 1970 por un investigador de IBM. No requiere que los desarrolladores
definan la ruta de datos. Aquí, los segmentos de datos se combinan explícitamente con la
ayuda de tablas. Este modelo ha reducido la complejidad del programa. Requiere un
conocimiento detallado del almacenamiento de datos físicos adoptado por la
organización. Poco después de la introducción de este modelo, se combinó con el lenguaje
de consulta estructurado (SQL).
Modelo de red: El modelo de red se puede construir sobre el modelo jerárquico, en el que
permite múltiples relaciones entre registros vinculados, lo que implica que tiene múltiples
registros principales. Según la teoría matemática de conjuntos, construimos el modelo con
conjuntos de registros relacionados. Cada conjunto consta de un registro principal y varios
registros secundarios. Cada registro puede pertenecer a varios conjuntos y permite que el
modelo transmita relaciones complejas.
Modelo de base de datos orientado a objetos: El modelo de base de datos orientada a
objetos consta de una colección de objetos. Estos objetos tienen funciones y métodos
asociados. Tenemos varios tipos de bases de datos orientadas a objetos, a saber, base de
datos multimedia, base de datos de hipertexto y más. Este tipo de modelo de base de
datos se conoce como modelo de base de datos post-relacional, ya que no se limita a
tablas, aunque incorpora tablas. Podemos llamar a estos tipos de modelos de base de
datos modelos híbridos.
Modelo entidad-relación: Como su nombre indica, el modelo entidad-relación es una
presentación gráfica de entidades y sus relaciones. También se conoce como diagrama
entidad-relación (E – R). Una entidad puede denominarse como un concepto, un dato o un
objeto sobre el que se almacenan los datos (y las relaciones que los rodean).
Modelo relacional de objetos: Podemos pensar en el modelo relacional de objetos como
un modelo relacional que tiene la funcionalidad avanzada del modelo de base de datos
orientada a objetos. Lo que permite este tipo de modelo de base de datos es permitir que
los diseñadores incorporen las funciones en una estructura de tabla familiar.
Hechos y dimensiones
Para aprender a modelar datos, uno realmente necesita comprender sus hechos y dimensiones.
Tabla de hechos: es una tabla que contiene las medidas y la granularidad de cada medida.
Los hechos pueden ser aditivos o semi aditivos, por ejemplo, ventas.
Tabla de dimensiones: es una tabla que recopila campos que contienen descripciones de
elementos comerciales y es referenciada por múltiples tablas de hechos.
Modelado dimensional
El modelado dimensional es una técnica de diseño de almacenamiento de datos. Utiliza
dimensiones y hechos confirmados y ayuda a facilitar la navegación. El diseño de modelado
dimensional ayuda en consultas de rendimiento rápido. Los modelos dimensionales se conocen
casualmente como esquemas en estrella.
El proceso de modelado de datos implica diseñar y producir todo tipo de modelos de datos. Estos
modelos de datos se convierten luego a través de un lenguaje de definición de datos. El lenguaje
de definición de datos se utiliza para generar una base de datos. Esta base de datos se denominará
modelo de datos totalmente atribuidos.
Los objetos de datos proporcionados por el equipo funcional se presentan con precisión
con el modelado de datos.
El modelado de datos le permite consultar datos de la base de datos y derivar varios
informes basados en los datos. Contribuye indirectamente al análisis de datos con la ayuda
de informes. Estos informes se pueden utilizar para mejorar la calidad y la productividad
del proyecto.
Las empresas tienen muchos datos en una variedad de formatos. El modelado de datos
proporciona un sistema estructurado para este tipo de formas de datos no estructuradas.
El modelado de datos mejora la inteligencia empresarial al hacer que los modeladores de
datos trabajen en estrecha colaboración con las realidades básicas del proyecto, que
incluyen la recopilación de datos de múltiples fuentes no estructuradas, requisitos de
informes, patrones de gasto, etc.
Mejora la comunicación en toda la organización.
Ayuda a documentar el mapeo de datos durante el proceso ETL.
Desventajas
El desarrollo de un modelo de datos es un trabajo muy tedioso. Se deben conocer las
características físicas del almacenamiento de datos.
Este sistema implica el desarrollo de aplicaciones complejas y el conocimiento de la
verdad biográfica.
El modelo no es muy fácil de usar. Los pequeños cambios inducidos en el sistema
requieren una modificación importante en toda la aplicación.
Los modelos de datos se desarrollan para que los datos se almacenen en una base de datos. El
principal objetivo de estos modelos de datos es garantizar que los objetos de datos creados por el
equipo funcional se denoten con precisión. Como se dijo anteriormente, incluso el cambio más
pequeño en el sistema requerirá cambios en todo el modelo. Sin embargo, a pesar de algunos
inconvenientes, el concepto de modelado de datos es la primera y principal fase del diseño de la
base de datos, ya que define las entidades de datos, las relaciones entre los objetos de datos, etc.
Un modelo de datos habla de manera integral sobre las reglas comerciales, las políticas
gubernamentales y el cumplimiento normativo. en los datos.
Hay muchas formas de realizar un modelo y este proceso se le llama modelado de datos el cual
consiste en:
El primer paso es identificar las tablas de datos, es decir se identifican las entidades de negocio, o
sea, conjuntos de datos estructurados que representan una entidad de negocio. A cada entidad de
negocio se le llama Tabla.
Al analizar las métricas propias de una empresa, se pueden obtener las entidades de que se trata.
Por ejemplo, en el caso de un Hospital algunas entidades de negocio o tablas serían: visitas,
quejas, pacientes, citas, doctores, medicamentos, recetas, hospitales. Recuerda una tabla por cada
entidad. Todas ellas tienen o sirven para un propósito
Si analizamos en otro aspecto, una escuela podría tener tablas como escuelas, asistencia,
calificaciones, estudiantes, materias, exámenes, et.
Otro ejemplo bastante común es un negocio dedicado a la venta de productos. Las entidades
pudieran ser ventas, devoluciones, tiendas, clientes, vendedores, productos, etc.
Algo a destacar en estas entidades de negocio es que se deben diferenciar ya que el propósito de
cada una de estas tablas va a ser distinto pues se van a tener tablas FACT o de hechos y tabla DIM
o de dimensiones
Y, ¿a qué se refiere esto? Pues a que las tablas FAC se consideran como todos aquellos eventos
que pueden medirse y por lo general estas tablas tienen millones de registros y pocos campos o
columnas
Por ejemplo, en el caso de Hospital, las tablas de hechos o FACT, serían las visitas o las quejas.
Mientras que las tablas de dimensiones son aquellas usadas para segmentar las tablas FACT y
éstas por lo general responde a las preguntas: qué, quién, cómo, cuándo y dónde sucedió el
evento medido.
Por ejemplo, si quisiéramos contestar donde sucedió tal número de visitas, el dónde sería en los
hospitales. Entonces pudiéramos segmentar las visitas por los hospitales. Si quisiéramos contestar
quién tuvo ciertas visitas pudiéramos revisar los pacientes de la tabla de pacientes que tuvieron
visitas.
Entonces, vamos a estar relacionando las tablas de hechos con las tablas de dimensiones par
poder segmentar los eventos que se están midiendo.
Si tomamos el ejemplo de las escuelas, pudiéramos revisar la asistencia que se tuvo en tantas
escuelas
Y así mismo para los enveto de las ventas o devoluciones pudiéramos revisarlas por las distintas
dimensiones o categorías que tenemos en las otras tablas
Esto nos da una idea de la importancia de conocer cómo se relacionan las tablas entre sí.
En el paso 2, se identifican las relaciones entres las tablas o entidades de negocio y se repesentan
mediante modelos, de los cuales vamos a conocer los dos más comunes
El primero es el esquema de estrella, en cuyo centro se tiene una tabla FACT con millones de
registros y a su alrededor, en forma de estrella, se tienen las distintas dimensiones que
responderán al proceso central o a las preguntas que habíamos mencionado anteriormente: qué,
quién, cómo, cuándo, dónde.
Todo este tipo de preguntas las van a contestara las dimensiones y este esquema estrella nos va a
ayudar a procesarlo inmensas cantidades de información rápidamente.
Pero si quisiéramos medir no solo las ventas por ejemplo en este caso, y quisiéramos medir otros
hechos o tablas FACT habría que acomodar este modelo de otra forma en donde las dimensiones
irían en la parte superior y los eventos o tablas FACT irían en la parte inferior. Esto nos permitiría
agregar más tablas de eventos.
Referencias
Blog IntelliPaat. (31 de Agosto de 2021). Obtenido de IntelliPaat:
https://intellipaat.com/blog/data-modeling-tutorial-for-beginners/
datdata. (29 de Enero de 2020). Curso DAX en Power BI (2020) - Buenas Prácticas de Modelado de
Datos. Obtenido de https://www.youtube.com/watch?
v=ocFidgPH6AM&list=RDCMUC6DnLOwz8R0iZPmkZ3vMM1g&start_radio=1&t=3s&ab_ch
annel=datdata