0% encontró este documento útil (0 votos)
239 vistas6 páginas

2.1 Modelo de Datos

Un modelo de datos es un conjunto de tablas relacionadas que permiten realizar un análisis profundo de procesos de negocio. Los modelos de datos son necesarios para organizar grandes cantidades de datos y optimizar reportes. El modelado de datos implica crear una representación estructurada de los objetos de datos y sus relaciones para facilitar el análisis y satisfacer los requisitos del negocio. Existen diferentes tipos de modelos como el relacional, jerárquico y orientado a objetos.

Cargado por

jose maria
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
239 vistas6 páginas

2.1 Modelo de Datos

Un modelo de datos es un conjunto de tablas relacionadas que permiten realizar un análisis profundo de procesos de negocio. Los modelos de datos son necesarios para organizar grandes cantidades de datos y optimizar reportes. El modelado de datos implica crear una representación estructurada de los objetos de datos y sus relaciones para facilitar el análisis y satisfacer los requisitos del negocio. Existen diferentes tipos de modelos como el relacional, jerárquico y orientado a objetos.

Cargado por

jose maria
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 6

Modelo de Datos

Un modelo de datos es el conjunto de diversas fuentes de datos o el conjunto de distintas tablas


que al relacionarlas nos permiten realizar un análisis más profundo de algún proceso del negocio.

Los modelos de datos son sumamente necesarios cuando contamos con tablas con millones de
registros y en donde se requiere que los reportes estén lo más optimizado posible para cargar y
transformar los datos y lo usuarios puedan interactuar de la forma más fluida con la información

¿Qué es el modelado de datos?


El proceso de crear un modelo para el almacenamiento de datos en una base de datos se
denomina modelado de datos. Es una presentación teórica de objetos de datos y asociaciones
entre varios objetos de datos. El modelado de datos es un proceso de formulación de datos en un
sistema de información en un formato estructurado. Ayuda a analizar datos fácilmente, lo que
ayudará aún más a cumplir con los requisitos comerciales.

El proceso de modelado de datos requiere modeladores de datos que trabajarán precisamente


con las partes interesadas y los posibles usuarios de un sistema de información. El proceso de
modelado de datos finaliza con la creación de un modelo de datos que respalda la infraestructura
del sistema de información empresarial. Este proceso también implica comprender la estructura
de una organización y proponer una solución que permita a la organización alcanzar sus objetivos.
Sirve de puente entre las áreas técnicas y funcionales.

¿Por qué utilizar un modelo de datos?

Las razones principales para usar un modelo de datos se enumeran a continuación:

 La representación visual de datos ayuda a mejorar el análisis de datos. Proporciona una


imagen holística de los datos que los desarrolladores pueden utilizar para crear una base
de datos física.
 Todos los datos importantes de una empresa se presentan con precisión en el modelo. El
modelo de datos reduce las posibilidades de omisión de datos. La omisión de datos puede
dar lugar a resultados incorrectos e informes defectuosos.
 El modelo de datos muestra una mejor comprensión de los requisitos comerciales.
 Ayuda en la creación de un diseño robusto que reúne todos los datos de una organización
en la misma plataforma. También ayuda a identificar los datos redundantes, duplicados y
faltantes.
 Un modelo de datos calificado ayuda a proporcionar una mejor coherencia en todos los
proyectos de una empresa.
 Mejora la calidad de los datos.
 Ayuda a los Project Managers con una mejor gestión del alcance y la calidad. También
mejora el rendimiento hasta la médula.
 Define tablas relacionales, procedimientos almacenados y claves primarias y externas.

Tres perspectivas de un modelo de datos


 Modelo conceptual: Este nivel define lo que debe estar presente en la estructura del
modelo para definir y organizar conceptos de negocio. Se centra principalmente en
entradas, atributos y relaciones orientadas a los negocios. Básicamente está diseñado por
arquitectos de datos y partes interesadas comerciales.
 Modelo lógico: El modelo lógico define cómo se debe implementar el modelo. En general,
incluye todo tipo de datos que deben capturarse, como tablas, columnas, etc. Este modelo
generalmente está diseñado por analistas de negocios y arquitectos de datos.
 Modelo físico: El modelo físico define cómo implementar un modelo de datos con la ayuda
del sistema de gestión de la base de datos. Describe la metodología de implementación en
términos de tablas, operaciones CRUD, índices, particiones, etc. Es creado por
Administradores y Desarrolladores de Base de Datos.

Tipos de modelos de datos


Existen varios enfoques para el modelado de datos, pero el concepto básico sigue siendo el mismo
para todos los tipos de modelos. Echemos un vistazo a algunos de los modelos de datos que se
utilizan popularmente:

 Modelo jerárquico: Este es un modelo de base de datos que se basa en una estructura en
forma de árbol. Aquí, cada uno de los registros tiene una única raíz o padre. Cuando se
trata de registros de hermanos, se ordenan en un orden particular. Este orden se utiliza
como orden físico para almacenar la base de datos. Puede utilizar este tipo de modelado
para muchas relaciones de modelos del mundo real. Durante las décadas de 1960 y 1970,
este modelo de base de datos estaba de moda. Pero debido a algunas ineficiencias, ahora
se utilizan muy raramente.
 Modelo relacional: Esto fue propuesto inicialmente como una alternativa al modelo
jerárquico en 1970 por un investigador de IBM. No requiere que los desarrolladores
definan la ruta de datos. Aquí, los segmentos de datos se combinan explícitamente con la
ayuda de tablas. Este modelo ha reducido la complejidad del programa. Requiere un
conocimiento detallado del almacenamiento de datos físicos adoptado por la
organización. Poco después de la introducción de este modelo, se combinó con el lenguaje
de consulta estructurado (SQL).
 Modelo de red: El modelo de red se puede construir sobre el modelo jerárquico, en el que
permite múltiples relaciones entre registros vinculados, lo que implica que tiene múltiples
registros principales. Según la teoría matemática de conjuntos, construimos el modelo con
conjuntos de registros relacionados. Cada conjunto consta de un registro principal y varios
registros secundarios. Cada registro puede pertenecer a varios conjuntos y permite que el
modelo transmita relaciones complejas.
 Modelo de base de datos orientado a objetos: El modelo de base de datos orientada a
objetos consta de una colección de objetos. Estos objetos tienen funciones y métodos
asociados. Tenemos varios tipos de bases de datos orientadas a objetos, a saber, base de
datos multimedia, base de datos de hipertexto y más. Este tipo de modelo de base de
datos se conoce como modelo de base de datos post-relacional, ya que no se limita a
tablas, aunque incorpora tablas. Podemos llamar a estos tipos de modelos de base de
datos modelos híbridos.
 Modelo entidad-relación: Como su nombre indica, el modelo entidad-relación es una
presentación gráfica de entidades y sus relaciones. También se conoce como diagrama
entidad-relación (E – R). Una entidad puede denominarse como un concepto, un dato o un
objeto sobre el que se almacenan los datos (y las relaciones que los rodean).
 Modelo relacional de objetos: Podemos pensar en el modelo relacional de objetos como
un modelo relacional que tiene la funcionalidad avanzada del modelo de base de datos
orientada a objetos. Lo que permite este tipo de modelo de base de datos es permitir que
los diseñadores incorporen las funciones en una estructura de tabla familiar.

Hechos y dimensiones
Para aprender a modelar datos, uno realmente necesita comprender sus hechos y dimensiones.

 Tabla de hechos: es una tabla que contiene las medidas y la granularidad de cada medida.
Los hechos pueden ser aditivos o semi aditivos, por ejemplo, ventas.
 Tabla de dimensiones: es una tabla que recopila campos que contienen descripciones de
elementos comerciales y es referenciada por múltiples tablas de hechos.

Modelado dimensional
El modelado dimensional es una técnica de diseño de almacenamiento de datos. Utiliza
dimensiones y hechos confirmados y ayuda a facilitar la navegación. El diseño de modelado
dimensional ayuda en consultas de rendimiento rápido. Los modelos dimensionales se conocen
casualmente como esquemas en estrella.

Claves relacionadas con el modelado dimensional


Es importante comprender las claves mientras aprendemos a modelar datos. Las claves del
modelado dimensional se dividen en cinco categorías:

 Claves comerciales o naturales: es un campo que identifica de manera única a una


entidad. Por ejemplo, ID de cliente, número de empleado, etc.
 Claves principales y alternativas: cualquier campo que contenga un registro único se
puede llamar como clave principal. El usuario debe seleccionar una de todas las claves
primarias disponibles y las restantes se convierten en claves alternativas.
 Claves compuestas: cuando se utiliza más de un campo para representar una clave, se
denomina clave compuesta.
 Claves sustitutas: es un campo sin significado comercial y generalmente se genera
automáticamente.
 Claves externas: es una clave que apunta a otra clave en alguna otra tabla.

El proceso de modelado de datos implica diseñar y producir todo tipo de modelos de datos. Estos
modelos de datos se convierten luego a través de un lenguaje de definición de datos. El lenguaje
de definición de datos se utiliza para generar una base de datos. Esta base de datos se denominará
modelo de datos totalmente atribuidos.

Ventajas y desventajas de los modelos de datos


Ventajas

 Los objetos de datos proporcionados por el equipo funcional se presentan con precisión
con el modelado de datos.
 El modelado de datos le permite consultar datos de la base de datos y derivar varios
informes basados en los datos. Contribuye indirectamente al análisis de datos con la ayuda
de informes. Estos informes se pueden utilizar para mejorar la calidad y la productividad
del proyecto.
 Las empresas tienen muchos datos en una variedad de formatos. El modelado de datos
proporciona un sistema estructurado para este tipo de formas de datos no estructuradas.
 El modelado de datos mejora la inteligencia empresarial al hacer que los modeladores de
datos trabajen en estrecha colaboración con las realidades básicas del proyecto, que
incluyen la recopilación de datos de múltiples fuentes no estructuradas, requisitos de
informes, patrones de gasto, etc.
 Mejora la comunicación en toda la organización.
 Ayuda a documentar el mapeo de datos durante el proceso ETL.

Desventajas
 El desarrollo de un modelo de datos es un trabajo muy tedioso. Se deben conocer las
características físicas del almacenamiento de datos.
 Este sistema implica el desarrollo de aplicaciones complejas y el conocimiento de la
verdad biográfica.
 El modelo no es muy fácil de usar. Los pequeños cambios inducidos en el sistema
requieren una modificación importante en toda la aplicación.

Los modelos de datos se desarrollan para que los datos se almacenen en una base de datos. El
principal objetivo de estos modelos de datos es garantizar que los objetos de datos creados por el
equipo funcional se denoten con precisión. Como se dijo anteriormente, incluso el cambio más
pequeño en el sistema requerirá cambios en todo el modelo. Sin embargo, a pesar de algunos
inconvenientes, el concepto de modelado de datos es la primera y principal fase del diseño de la
base de datos, ya que define las entidades de datos, las relaciones entre los objetos de datos, etc.
Un modelo de datos habla de manera integral sobre las reglas comerciales, las políticas
gubernamentales y el cumplimiento normativo. en los datos.

Hay muchas formas de realizar un modelo y este proceso se le llama modelado de datos el cual
consiste en:

1. identificar las tablas de datos


2. Relacionar las tablas de datos
3. Obtener un diagrama representativo

Vamos a dar un panorama de estos tres pasos

El primer paso es identificar las tablas de datos, es decir se identifican las entidades de negocio, o
sea, conjuntos de datos estructurados que representan una entidad de negocio. A cada entidad de
negocio se le llama Tabla.

Al analizar las métricas propias de una empresa, se pueden obtener las entidades de que se trata.
Por ejemplo, en el caso de un Hospital algunas entidades de negocio o tablas serían: visitas,
quejas, pacientes, citas, doctores, medicamentos, recetas, hospitales. Recuerda una tabla por cada
entidad. Todas ellas tienen o sirven para un propósito
Si analizamos en otro aspecto, una escuela podría tener tablas como escuelas, asistencia,
calificaciones, estudiantes, materias, exámenes, et.

Otro ejemplo bastante común es un negocio dedicado a la venta de productos. Las entidades
pudieran ser ventas, devoluciones, tiendas, clientes, vendedores, productos, etc.

Algo a destacar en estas entidades de negocio es que se deben diferenciar ya que el propósito de
cada una de estas tablas va a ser distinto pues se van a tener tablas FACT o de hechos y tabla DIM
o de dimensiones

Y, ¿a qué se refiere esto? Pues a que las tablas FAC se consideran como todos aquellos eventos
que pueden medirse y por lo general estas tablas tienen millones de registros y pocos campos o
columnas

Por ejemplo, en el caso de Hospital, las tablas de hechos o FACT, serían las visitas o las quejas.
Mientras que las tablas de dimensiones son aquellas usadas para segmentar las tablas FACT y
éstas por lo general responde a las preguntas: qué, quién, cómo, cuándo y dónde sucedió el
evento medido.

Por ejemplo, si quisiéramos contestar donde sucedió tal número de visitas, el dónde sería en los
hospitales. Entonces pudiéramos segmentar las visitas por los hospitales. Si quisiéramos contestar
quién tuvo ciertas visitas pudiéramos revisar los pacientes de la tabla de pacientes que tuvieron
visitas.

Entonces, vamos a estar relacionando las tablas de hechos con las tablas de dimensiones par
poder segmentar los eventos que se están midiendo.

Si tomamos el ejemplo de las escuelas, pudiéramos revisar la asistencia que se tuvo en tantas
escuelas

Y así mismo para los enveto de las ventas o devoluciones pudiéramos revisarlas por las distintas
dimensiones o categorías que tenemos en las otras tablas

Esto nos da una idea de la importancia de conocer cómo se relacionan las tablas entre sí.

En el paso 2, se identifican las relaciones entres las tablas o entidades de negocio y se repesentan
mediante modelos, de los cuales vamos a conocer los dos más comunes

El primero es el esquema de estrella, en cuyo centro se tiene una tabla FACT con millones de
registros y a su alrededor, en forma de estrella, se tienen las distintas dimensiones que
responderán al proceso central o a las preguntas que habíamos mencionado anteriormente: qué,
quién, cómo, cuándo, dónde.

Todo este tipo de preguntas las van a contestara las dimensiones y este esquema estrella nos va a
ayudar a procesarlo inmensas cantidades de información rápidamente.

Pero si quisiéramos medir no solo las ventas por ejemplo en este caso, y quisiéramos medir otros
hechos o tablas FACT habría que acomodar este modelo de otra forma en donde las dimensiones
irían en la parte superior y los eventos o tablas FACT irían en la parte inferior. Esto nos permitiría
agregar más tablas de eventos.
Referencias
Blog IntelliPaat. (31 de Agosto de 2021). Obtenido de IntelliPaat:
https://intellipaat.com/blog/data-modeling-tutorial-for-beginners/

datdata. (29 de Enero de 2020). Curso DAX en Power BI (2020) - Buenas Prácticas de Modelado de
Datos. Obtenido de https://www.youtube.com/watch?
v=ocFidgPH6AM&list=RDCMUC6DnLOwz8R0iZPmkZ3vMM1g&start_radio=1&t=3s&ab_ch
annel=datdata

También podría gustarte