Base de Datos Tema 1
Base de Datos Tema 1
Base de Datos Tema 1
id=53772
Almacenamiento de la información.
Caso práctico
Ada sabe bien que BK Programación deberá hacer frente a retos importantes que requerirán del dominio
adecuado de múltiples disciplinas. Tiene claro que el desarrollo de sus proyectos ha de estar apoyado
sobre unas bases firmes, y una de ellas será la gestión adecuada de los datos.
Considera que Juan y María deben conocer la evolución que han experimentado las técnicas de
almacenamiento de información, destacando que el dominio de las bases de datos es fundamental para
garantizar un funcionamiento óptimo de las aplicaciones que BK Programación va a tener que
desarrollar.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 1/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
1.- Introducción.
¿Te has preguntado alguna vez dónde y de qué manera se almacenan y
gestionan los datos que utilizamos diariamente? Si pensamos en cualquier
acción de nuestra vida cotidiana, o si analizamos la mayoría de los ámbitos de
actividad, nos encontramos que la utilización de las bases de datos está
ampliamente extendida. Éstas, y los datos contenidos en ellas, serán
imprescindibles para llevar a cabo multitud de acciones.
Suponemos que no es necesario que continuemos más para darnos cuenta de que casi todo lo que nos rodea, en
alguna medida, está relacionado con los datos, su almacenamiento y su gestión. El gran volumen de datos que
actualmente manejamos y sus innumerables posibilidades requieren de la existencia de técnicos perfectamente
formados y capaces de trabajar con ellos.
Este módulo profesional se centra en el estudio de las Bases de Datos y su uso en el desarrollo de aplicaciones.
En esta primera unidad comenzaremos conociendo los primeros sistemas basados en ficheros para el
almacenamiento y gestión de la información. Seguidamente, se desarrollarán los conceptos y definiciones básicas
relacionadas con las bases de datos, posteriormente analizaremos sus modelos y tipos, un poco más adelante,
podremos conocer las características y capacidades de los sistemas gestores de bases de datos y finalmente,
identificaremos las herramientas reales con las que llevar a cabo la gestión dichas bases.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 2/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Juan le cuenta a María que hace poco visitó un museo en el que
había una exposición sobre historia de la informática y que pudo
ver soportes antiguos para almacenamiento de información:
tarjetas perforadas, cintas magnéticas, tambores magnéticos,
discos de diferentes tamaños y otros dispositivos de la época.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 3/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Al llevar a cabo una primera informatización, se pasó de tener los datos en formato
papel a poder acceder a ellos de manera mucho más rápida a través del ordenador.
En ese momento, la informática adaptó sus herramientas para que los elementos que
el usuario maneja en el ordenador se parezcan a los que utilizaba manualmente. Así
en informática se sigue hablado de ficheros, formularios, carpetas, directorios,...
La información debía ser trasladada desde el papel al formato digital y por lo general, era necesario almacenarla
para su posterior recuperación, consulta y procesamiento. De este modo, para llevar a cabo un tratamiento eficiente
de ésta era necesario establecer métodos adecuados para su almacenamiento. El elemento que permitió llevar a
cabo el almacenamiento de datos de forma permanente en dispositivos de memoria masiva fue el fichero o
archivo.
Fichero o archivo: conjunto de información relacionada, tratada como un todo y organizada de forma
estructurada. Es una secuencia de dígitos binarios que organiza información relacionada con un mismo
aspecto.
Los ficheros están formados por registros lógicos que contienen datos relativos a un mismo elemento u objeto (por
ejemplo, los datos de usuarios de una plataforma educativa). A su vez, los registros están divididos en campos que
contienen cada una de las informaciones elementales que forman un registro (por ejemplo, el nombre del usuario o
su dirección de correo electrónico).
Hemos de resaltar que los datos están almacenados de tal forma que se puedan añadir, suprimir, actualizar o
consultar individualmente en cualquier momento.
Como los ficheros suelen ser muy voluminosos, solo se pueden llevar a la memoria principal partes de ellos para
poder procesarlos. La cantidad de información que es transferida entre el soporte en el que se almacena el fichero,
y la memoria principal del ordenador, en una sola operación de lectura/grabación, recibe el nombre de registro
físico o bloque.
Normalmente en cada operación de lectura/grabación se transfieren varios registros del fichero, es decir un bloque
suele contener varios registros lógicos. Al número de registros que entran en un bloque se le conoce con el nombre
de factor de blocaje, y a esta operación de agrupar varios registros en un bloque se le llama bloqueo de
registros.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 4/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
a. Ficheros permanentes: contienen información relevante para una aplicación. Es decir, los datos necesarios
para el funcionamiento de ésta. Tienen un periodo de permanencia en el sistema amplio. Estos se subdividen
en:
Ficheros maestros: contienen el estado actual de los datos que pueden modificarse desde la
aplicación. Es la parte central de la aplicación, su núcleo. Podría ser un archivo con los datos de los
usuarios de una plataforma educativa.
Ficheros constantes: son aquellos que incluyen datos fijos para la aplicación. No suelen ser
modificados y se accede a ellos para realización de consultas. Podría ser un archivo con códigos
postales.
Ficheros históricos: contienen datos que fueron considerados como actuales en un periodo o
situación anterior. Se utilizan para la reconstrucción de situaciones. Podría ser un archivo con los
usuarios que han sido dados de baja en la plataforma educativa.
b. Ficheros temporales: Se utilizan para almacenar información útil para una parte de la aplicación, no para
toda ella. Son generados a partir de datos de ficheros permanentes. Tienen un corto periodo de existencia.
Estos se subdividen en:
Ficheros intermedios: almacenan resultados de una aplicación que serán utilizados por otra.
Ficheros de maniobras: almacenan datos de una aplicación que no pueden ser mantenidos en
memoria principal por falta de espacio.
Ficheros de resultados: almacenan datos que van a ser transferidos a un dispositivo de salida.
Autoevaluación
Supongamos una aplicación informática para gestionar una biblioteca, existirá un fichero con el
catálogo de libros disponibles, otro con las editoriales, otro con información sobre libros que se
han quedado obsoletos, etc. ¿A cuál de los siguientes tipos correspondería el fichero que
almacena las editoriales?
Fichero maestro.
Fichero constante.
Fichero intermedio.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 5/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Soportes de Acceso Directo a los datos (Por ejemplo: discos). Son los más empleados y el acceso a los
datos puede hacerse de forma directa, pudiendo colocarnos en la posición que nos interesa y leer a partir de
ella.
Soportes de Acceso Secuencial (Por ejemplo: cintas magnéticas). Se suelen usar en copias de seguridad y
si deseamos leer un dato que está en la mitad de la cinta, tendremos que leer todo lo que hay hasta llegar a
esa posición.
Discos magnéticos.
Discos ópticos.
Discos magneto-ópticos.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 6/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Las distintas formas de organizar un fichero en un soporte de memoria o, lo que se conoce también por métodos de
acceso a los ficheros se detallan en el siguiente gráfico.
Las organizaciones secuencial, de acceso aleatorio o directo y de acceso indexado son las más comunes. En los
siguientes epígrafes se detallarán las características de cada uno de los métodos de acceso a los ficheros.
Autoevaluación
Relaciona los diferentes métodos de acceso a los ficheros.
Ejercicio de relacionar.
Encadenado. 1. Directo.
Indexado. 2. Secuencial.
Enviar
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 7/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Este tipo de ficheros pueden utilizar dispositivos o soportes no direccionables o de acceso secuencial, como son las
cintas magnéticas de almacenamiento de datos. También se utiliza en los CD de audio y los DVD de vídeo, en los
que la música o las imágenes se almacenan a lo largo de una espiral continua.
Los registros almacenados se identifican por medio de una información ubicada en uno de sus campos, a este
campo se le denomina clave o llave. Si se ordena un archivo secuencial por su clave, es más rápido realizar
cualquier operación de lectura o escritura.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 8/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Campo clave: campo que permite identificar y localizar un registro de manera ágil y organizada.
Cada uno de los registros se guarda en una posición física, que dependerá del espacio disponible en memoria
masiva, de ahí que la distribución de los registros sea aleatoria dentro del soporte de almacenamiento. Para
acceder a la posición física de un registro se utiliza una dirección o índice, no siendo necesario recorrer todo el
fichero para encontrar un determinado registro.
A través de una transformación específica aplicada a la clave, se obtendrá la dirección física en la que se encuentra
el registro. Según la forma de realizar esta transformación, existen diferentes modos de acceso:
En el acceso directo la clave coincide con la dirección, debiendo ser numérica y comprendida dentro del rango de
valores de las direcciones. Es el método más rápido.
La medida básica de posicionamiento del puntero en el fichero es el byte, dependiendo del tipo de codificación de
caracteres que empleemos (Unicode, ANSI) se utilizarán 1 o 2 bytes por carácter respectivamente. Teniendo esto en
cuenta, el puntero avanzará de uno en uno o de dos en dos bytes para poder leer o escribir cada carácter.
Posicionamiento inmediato.
Registros de longitud fija.
Apertura del fichero en modo mixto, para lectura y escritura.
Permiten múltiples usuarios utilizándolos.
Los registros se borran colocando un cero en la posición que ocupan.
Permiten la utilización de algoritmos de compactación de huecos.
Los archivos se crean con un tamaño definido, es decir, con un máximo de registros establecido durante la
creación.
Esta organización sólo es posible en soportes direccionables.
Se usan cuando el acceso a los datos de un registro se hace siempre empleando la misma clave y la
velocidad de acceso a un registro es lo que más nos importa.
Permiten la actualización de los registros en el mismo fichero, sin necesidad de copiar el fichero.
Permiten realizar procesos de actualización en tiempo real.
Autoevaluación
En los ficheros de acceso directo los registros siempre se encuentran en posiciones contiguas
dentro del soporte de almacenamiento.
Verdadero. Falso.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 9/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Por tanto, existirá una zona de registros en la que se encuentran los datos del archivo y una zona de índices, que
contiene una tabla con las claves de los registros y las posiciones donde se encuentran los mismos. La tabla de
índices estará ordenada por el campo clave.
La tabla de índices será cargada en memoria principal para realizar en ella la búsqueda de la fila correspondiente a
la clave del registro a encontrar, obteniéndose así la dirección donde se encuentra el registro. Una vez localizada la
dirección, sólo hay que acceder a la zona de registros en el soporte de almacenamiento y posicionarnos en la
dirección indicada. Puesto que la tabla debe prever la inclusión de todas las direcciones posibles del archivo, su
principal inconveniente resulta determinar su tamaño y mantenerla ordenada por los valores de la clave.
El diseño del registro tiene que tener un campo, o combinación de campos, que permita identificar cada
registro de forma única, es decir, que no pueda haber dos registros que tengan la misma información en él. A
este campo se le llama campo clave y es el que va a servir de índice. Un mismo fichero puede tener mas de
un campo clave, pero al menos uno de ellos no admitirá valores duplicados y se le llama clave primaria. A las
restantes se les llama claves alternativas.
Permiten utilizar el modo de acceso secuencial y el modo de acceso directo para leer la información
guardada en sus registros.
Para acceder a este tipo de ficheros utilizando el modo de acceso directo se hace conociendo el contenido
del campo clave del registro que queremos localizar. Con esa información el sistema operativo puede
consultar el índice y conocer la posición del registro dentro del fichero.
Para acceder a este tipo de ficheros utilizando el modo de acceso secuencial los registros son leídos
ordenados por el contenido del campo clave, independientemente del orden en que se fueron grabando (el
orden lógico no es igual al orden físico), debido a que el acceso a los datos se hace a través del índice, que
para hacer más fácil la búsqueda de los registros, permanece siempre ordenado por el campo clave.
Solamente se puede grabar en un soporte direccionable.Por ejemplo, un disco magnético. Si esto no fuera
así, no podría emplear el acceso directo.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 10/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Esta organización es muy utilizada, tanto para procesos en los que intervienen pocos registros como para
aquellos en los que se maneja el fichero completo.
Permite el acceso secuencial. Esto es muy interesante cuando la tasa de actividad es alta. En el
acceso secuencial, además, los registros se leen ordenados por el campo clave.
Permite el acceso directo a los registros. Realmente emula el acceso directo, empleando para ello las
tablas de índices. Primero busca la clave en el área de índices y luego va a leer al área de datos en la
dirección que le indica la tabla.
Se pueden actualizar los registros en el mismo fichero, sin necesidad de crear un fichero nuevo de
copia en el proceso de actualización.
Ocupa mas espacio en el disco que los ficheros secuenciales, debido al uso del área de índices.
Solo se puede utilizar soportes direccionables.
Obliga a una inversión económica mayor, por la necesidad de programas y, a veces, hardware mas
sofisticado.
b. Ficheros de Acceso Calculado o Hash:
Cuando utilizamos ficheros indexados es necesario siempre tener que consultar una tabla para obtener la
dirección de almacenamiento a partir de la clave. La técnica del acceso calculado o hash, permite accesos
más rápidos, ya que en lugar de consultar una tabla, se utiliza una transformación o función matemática
(función de hashing) conocida, que a partir de la clave genera la dirección de cada registro del archivo. Si la
clave es alfanumérica, deberá previamente ser transformada en un número.
El mayor problema que presenta este tipo de ficheros es que a partir de diferentes claves se obtenga la
misma dirección al aplicar la función matemática o transformación. A este problema se le denomina colisión,
y las claves que generan la misma dirección se conocen por sinónimos. Para resolver este problema se
aplican diferentes métodos, como tener un bloque de excedentes o zona de sinónimos, o crear un archivo de
sinónimos, etc.
Módulo: La dirección será igual al resto de la división entera entre la clave y el número de registros.
Extracción: La dirección será igual a una parte de las cifras que se extraen de la clave.
Una buena transformación o función de hash, será aquella que produzca el menor número de colisiones. En
este caso hay que buscar una función, a ser posible biunívoca, que relacione los posibles valores de la clave
con el conjunto de números correlativos de dirección. Esta función consistirá en realizar una serie de cálculos
matemáticos con el valor de la clave hasta obtener un número entre 1 y n, siendo n el número de direcciones
que tiene el fichero.
Autoevaluación
En un fichero con acceso calculado:
Se utiliza la dirección como clave.
Hay una tabla en la que está cada clave con la dirección del registro correspondiente.
La dirección se obtiene a partir de la clave mediante un algoritmo.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 11/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Autoevaluación
La volatilidad de un fichero es un parámetro que indica:
La variación del volumen del fichero.
La cantidad de veces que se abre o cierra el fichero.
El peso de los procesos de inserción y borrado en dicho fichero (frecuencia de renovación).
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 12/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Ada, Juan y María, se han reunido para aclarar ideas sobre qué sistema
de gestión de información van a utilizar.
-Bases de datos, está claro. Pero, hay de varios tipos ¿no? -pregunta
Juan.
Continúa Ada: -Sé que todos conocemos lo que son las bases de datos,
pero es necesario afianzar y aclarar muchos conceptos fundamentales
que nos van hacer falta para plantear, diseñar y construir las bases de datos que nuestras aplicaciones
utilizarán.
Como hemos visto anteriormente, los ficheros permiten organizar y memorizar conjuntos de datos del mismo tipo o
naturaleza con una determinada estructura, siendo un medio para el almacenamiento de los datos o resultados de
una aplicación específica. Pero si las aplicaciones, al ser diseñadas, deben depender directamente de sus ficheros
o archivos, se pierde independencia y surgen serios inconvenientes: como información duplicada, incoherencia de
datos, fallos de seguridad, etc.
Estos problemas debían ser solucionados, es cuando aparece el concepto de base de datos. Una base de datos
permitirá reunir toda la información relacionada en un único sistema de almacenamiento, pudiendo cualquier
aplicación utilizarla de manera independiente y ofreciendo una mejora en el tratamiento de la información, así como
una evolución para el desarrollo de aplicaciones.
La gestión de las bases de datos ha experimentado gran cantidad de cambios, partiendo de aplicaciones
especializadas hasta llegar a convertirse en el núcleo de los entornos informáticos modernos. Con la llegada de
Internet en los noventa, el número de usuarios de bases de datos creció exponencialmente, y aunque muchos de
ellos no sean conscientes de ello, el acceso a dichas bases forma parte de la vida cotidiana de muchos de nosotros.
Conocer los sistemas que gestionan las bases de datos, sus conceptos fundamentales, el diseño, lenguajes y la
implementación de éstas, podemos considerarlo imprescindible para alguien que se está formando en el campo de
la informática.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 13/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
3.1.- Conceptos.
A finales de los setenta, la aparición de nuevas tecnologías de manejo de datos
a través de los sistemas de bases de datos supuso un considerable cambio. Los
sistemas basados en ficheros separados dieron paso a la utilización de
sistemas gestores de bases de datos, que son sistemas software centralizados
o distribuidos que ofrecen facilidades para la definición de bases de datos,
selección de estructuras de datos y búsqueda de forma interactiva o mediante
lenguajes de programación.
Base de datos: Es una colección de datos relacionados lógicamente entre sí, con una definición y
descripción comunes y que están estructurados de una determinada manera. Es un conjunto
estructurado de datos que representa entidades y sus interrelaciones, almacenados con la mínima
redundancia y posibilitando el acceso a ellos eficientemente por parte de varias aplicaciones y usuarios.
La base de datos no sólo contiene los datos de la organización, también almacena una descripción de dichos datos.
Esta descripción es lo que se denomina metadatos, se almacena en el diccionario de datos o catálogo y es lo
que permite que exista independencia de datos lógica-física.
Entidades: objeto real o abstracto con características diferenciadoras de otros, del que se almacena
información en la base de datos. En una base de datos de una clínica veterinaria, posibles entidades podrían
ser: ejemplar, doctor, consulta, etc.
Atributos: son los datos que se almacenan de la entidad. Cualquier propiedad o característica de una
entidad puede ser atributo. Continuando con nuestro ejemplo, podrían ser atributos: raza, color, nombre,
número de identificación, etc.
Registros: donde se almacena la información de cada entidad. Es un conjunto de atributos que contienen
los datos que pertenecen a una misma repetición de entidad. En nuestro ejemplo, un registro podría ser:
2123056, Sultán, Podenco, Gris, 23/03/2009.
Campos: donde se almacenan los atributos de cada registro. Teniendo en cuenta el ejemplo anterior, un
campo podría ser el valor Podenco.
Las ventajas fundamentales que ofrece el uso de bases de datos se resumen a continuación:
Resumen textual alternativo
Autoevaluación
Una base de datos es:
Un programa para gestionar archivos muy grandes.
El conjunto de datos de los usuarios almacenados en un único disco duro.
Conjunto de datos de distinto tipo relacionados entre sí, junto con un programa de gestión de
dichos datos.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 14/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
3.2.- Usos.
Ya sabemos lo que es una base de datos y sus características principales, pero
es necesario conocer quien las usa y para qué.
Existen cuatro tipos de personas que pueden hacer uso de una base de datos:
el administrador, los diseñadores de la base de datos, los programadores de
aplicaciones y los usuarios finales.
Enumerar todos y cada uno de los campos donde se utilizan las bases de datos es complejo, aunque seguro que
quedarán muchos en el tintero, a continuación se recopilan algunos de los ámbitos donde se aplican.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 16/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
A continuación, se exponen los sistemas de almacenamiento de información más utilizados para el despliegue de
bases de datos, comenzaremos por aquellos en los que pueden alojarse bases de datos de tamaño pequeño y
mediano, para después analizar los sistemas de alta disponibilidad de grandes servidores.
Discos SATA:Es una interfaz de transferencia de datos entre la placa base y algunos dispositivos de
almacenamiento, como puede ser el disco duro, lectores y regrabadores de CD/DVD/BD, Unidades de
Estado Sólido u otros dispositivos. SATA proporciona mayores velocidades, mejor aprovechamiento cuando
hay varias unidades, mayor longitud del cable de transmisión de datos y capacidad para conectar unidades al
instante, es decir, insertar el dispositivo sin tener que apagar el ordenador. La primera generación especifica
en transferencias de 150 Megabytes por segundo, también conocida por SATA 150 MB/s o Serial ATA-150.
Actualmente se comercializan dispositivos SATA II, a 300 MB/s, también conocida como Serial ATA-300 y los
SATA III con tasas de transferencias de hasta 600 MB/s.
Discos SCSI: Son interfaces preparadas para discos duros de gran capacidad de almacenamiento y
velocidad de rotación. Se presentan bajo tres especificaciones: SCSI Estándar (Standard SCSI), SCSI
Rápido (Fast SCSI) y SCSI Ancho-Rápido (Fast-Wide SCSI). Su tiempo medio de acceso puede llegar a 7
milisegundos y su velocidad de transmisión secuencial de información puede alcanzar teóricamente los 5
MB/s en los discos SCSI Estándares, los 10 MBps en los discos SCSI Rápidos y los 20 MBps en los discos
SCSI Anchos-Rápidos (SCSI-2). Un controlador SCSI puede manejar hasta 7 discos duros SCSI.
RAID: acrónimo de Redundant Array of Independent Disks o matriz de discos independientes, es un
contenedor de almacenamiento redundante. Se basa en el montaje en conjunto de dos o más discos
duros, formando un bloque de trabajo, para obtener desde una ampliación de capacidad a mejoras en
velocidad y seguridad de almacenamiento. Según las características que queramos primar, se establecen
distintos sistemas de RAID.
Sistemas NAS: Es el acrónimo de Network Attached Storage ó sistema de almacenamiento masivo en red.
Estos sistemas de almacenamiento permiten compartir la capacidad de almacenamiento de un computador
(Servidor) con ordenadores personales o servidores clientes a través de una red, haciendo uso de un
sistema operativo optimizado para dar acceso a los datos a través de protocolos de comunicación
específicos. Suelen ser dispositivos para almacenamiento masivo de datos con capacidades muy altas, de
varios Terabytes, generalmente superiores a los discos duros externos y además se diferencian de estos al
conectar por red.
Sistemas SAN: Acrónimo de Storage Area Network o red de área de almacenamiento.Se trata de una red
concebida para conectar servidores, matrices (arrays) de discos y librerías de soporte. La arquitectura de
este tipo de sistemas permite que los recursos de almacenamiento estén disponibles para varios servidores
en una red de área local o amplia. Debido a que la información almacenada no reside directamente en
ninguno de los servidores de la red, se optimiza el poder de procesamiento para aplicaciones comerciales y
la capacidad de almacenamiento se puede proporcionar en el servidor donde más se necesite.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 17/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Autoevaluación
Rellena los huecos con los conceptos adecuados.
Un tipo de red donde se optimiza el poder de procesamiento para aplicaciones comerciales, pudiendo
proporcionarse la capacidad de almacenamiento en el servidor donde más se necesite, se denomina
sistema .
Enviar
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 18/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Juan tiene ya experiencia con bases de datos: -Registros, tablas,
relaciones, claves,... tiene su teoría, pero dame un problema a
resolver y casi puedo construir la base de datos en un abrir y cerrar
de ojos.
Ada indica a María: -Las bases de datos no siempre han sido como las conocemos ahora, han habido
diferentes modelos para su construcción y es bueno conocer la evolución de éstos para comprender por
qué utilizaremos el modelo de bases de datos relacional.
La clasificación tradicional de las bases de datos establece tres modelos de bases de datos: jerárquico, en red y
relacional. En la actualidad el modelo de bases de datos más extendido es el relacional. Aunque, hay que tener en
cuenta que dos de sus variantes (modelo de bases de datos distribuidas y orientadas a objetos) son las que se más
se están utilizando en los últimos tiempos.
En los siguientes epígrafes analizaremos cada uno de ellos, así como otros modelos de bases de datos existentes.
Debes conocer
Conoce las características generales y graba en tu memoria fotográfica los gráficos que representan a
cada uno de los modelos expuestos en el siguiente artículo:
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 19/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
La información se organiza con un jerarquía en la que la relación entre las entidades de este modelo siempre es del
tipo padre/hijo. De tal manera que existen nodos que contienen atributos o campos y que se relacionarán con sus
nodos hijos, pudiendo tener cada nodo más de un hijo, pero un nodo siempre tendrá un sólo padre.
Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos. Los segmentos se relacionan
entre sí utilizando arcos. La forma visual de este modelo es de árbol invertido, en la parte superior están los padres
y en la inferior los hijos.
Hoy en día, debido a sus limitaciones, el modelo jerárquico está en desuso. En el siguiente gráfico puedes observar
la estructura de almacenamiento del modelo jerárquico.
El modelo jerárquico.
El enfoque jerárquico.
Autoevaluación
Rellena los huecos con los conceptos adecuados.
El modelo Jerárquico es un modelo muy rígido en el que las diferentes entidades se organizan en
niveles múltiples, de acuerdo a una estricta relación / , de manera que un
puede tener más de un , todos ellos localizados en el mismo nivel, y un
únicamente puede tener un situado en el nivel inmediatamente superior al suyo.
Enviar
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 20/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
El modelo en red organiza la información en registros (también llamados nodos) y enlaces. En los registros se
almacenan los datos, mientras que los enlaces permiten relacionar estos datos. Las bases de datos en red son
parecidas a las jerárquicas sólo que en ellas puede haber más de un padre.
En este modelo se pueden representar perfectamente cualquier tipo de relación entre los datos, pero hace muy
complicado su manejo. Al no tener que duplicar la información se ahorra espacio de almacenamiento.
El sistema de gestión de información basado en el modelo en red más popular es el sistema IDMS.
El modelo en red.
El enfoque en red.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 21/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
En el modelo relacional la base de datos es percibida por el usuario como un conjunto de tablas. Esta percepción es
sólo a nivel lógico, ya que a nivel físico puede estar implementada mediante distintas estructuras de
almacenamiento.
El modelo relacional utiliza tablas bidimensionales (relaciones) para la representación lógica de los datos y las
relaciones entre ellos. Cada relación (tabla) posee un nombre que es único y contiene un conjunto de columnas.
Se llamará registro, entidad o tupla a cada fila de la tabla y campo o atributo a cada columna de la tabla.
A los conjuntos de valores que puede tomar un determinado atributo, se le denomina dominio.
Una clave será un atributo o conjunto de atributos que identifique de forma única a una tupla.
A continuación puedes observar cómo es una relación con sus tuplas y atributos en el modelo relacional.
El lenguaje habitual para construir las consultas a bases de datos relacionales es SQL, Structured Query Language
o Lenguaje Estructurado de Consultas, un estándar implementado por los principales motores o sistemas de gestión
de bases de datos relacionales.
Durante su diseño, una base de datos relacional pasa por un proceso al que se conoce como normalización de una
base de datos.
El modelo relacional.
Autoevaluación
Rellena los huecos con los conceptos adecuados.
La de bases de datos relacional consiste en definir las reglas que
determinan las dependencias entre los datos de una base de datos relacional. Si definimos esta relación
o dependencia entre los elementos de una determinada base de datos de la manera más sencilla
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 22/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
posible, conseguiremos que la cantidad de espacio necesario para guardar los datos sea el menor
posible y la facilidad para actualizar la relación sea la mayor posible. Es decir, optimizaremos su
funcionamiento.
Enviar
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 23/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
El objetivo del modelo orientado a objetos es cubrir las limitaciones del modelo relacional. Gracias a este modelo se
incorporan mejoras como la herencia entre tablas, los tipos definidos por el usuario, disparadores almacenables en
la base de datos (triggers), soporte multimedia, etc.
Los conceptos más importantes del paradigma de objetos que el modelo orientado a objetos incorpora son:
Encapsulación - Propiedad que permite ocultar la información al resto de los objetos, impidiendo así
accesos incorrectos o conflictos.
Herencia - Propiedad a través de la cual los objetos heredan comportamiento dentro de una jerarquía de
clases.
Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a distintos tipos de objetos.
Desde la aparición de la programación orientada a objetos (POO u OOP) se empezó a pensar en bases de datos
adaptadas a estos lenguajes. Este modelo es considerado como el fundamento de las bases de datos de tercera
generación, siendo consideradas las bases de datos en red como la primera y las bases de datos relacionales como
la segunda generación. Aunque no han reemplazado a las bases de datos relacionales, si son el tipo de base de
datos que más está creciendo en los últimos años.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 24/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
a. Modelo Objeto-Relacional
Las bases de datos pertenecientes a este modelo, son un híbrido entre las bases del modelo relacional y el
orientado a objetos. El mayor inconveniente de las bases de datos orientadas a objetos radica en los costes
de la conversión de las bases de datos relacionales a bases de datos orientadas a objetos.
En una base de datos objeto-relacional (BDOR) siempre se busca obtener lo mejor del modelo relacional,
incorporando las mejoras ofrecidas por la orientación a objetos. En este modelo se siguen almacenando
tuplas, aunque la estructura de las tuplas no está restringida sino que las relaciones pueden ser definidas en
función de otras, que es lo que denominamos herencia directa.
El estándar en el que se basa este modelo es SQL99. Este estándar ofrece la posibilidad de añadir a las
bases de datos relacionales procedimientos almacenados de usuario, triggers, tipos definidos por el usuario,
consultas recursivas, bases de datos OLAP, tipos LOB, ...
Otra característica a destacar es la capacidad para incorporar funciones que tengan un código en algún
lenguaje de programación como por ejemplo: SQL, Java, C, etc.
La gran mayoría de las bases de datos relacionales clásicas de gran tamaño, como Oracle, SQL Server, etc.,
son objeto-relacionales.
Las bases de datos deductivas son también llamadas bases de datos lógicas, al basarse en lógica
matemática. Surgieron para contrarrestar las limitaciones del modelo relacional para la respuesta a consultas
recursivas y la deducción de relaciones indirectas entre los datos almacenados.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 25/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
María pregunta a Ada: ─Si nuestras aplicaciones van a ser
accesibles desde Internet ¿Qué tipo de base de datos
utilizaremos?
─Lo importante es que hagamos un buen diseño y planificación de nuestras bases de datos. De este
modo, el software que desarrollemos irá sobre ruedas. ─ Añade Juan.
Como hemos visto, por cada modelo de datos se establecen sustanciales diferencias entre unas bases de datos y
otras, pero, ¿Esta es la única clasificación de las bases de datos existente? No, vamos a ver a continuación una
detallada descripción de los tipos de bases de datos teniendo en cuenta varios criterios.
Debes conocer
Accede a través del siguiente documento una completa clasificación de las bases de datos, teniendo en
cuenta diferentes puntos de vista, podrás conocer la gran variedad de tipos que existen.
Autoevaluación
Las bases de datos en las que sus registros no contienen el texto original sino tan sólo la
información fundamental para describir y permitir la localización de documentos impresos,
sonoros, iconográficos, audiovisuales o electrónicos, reciben el nombre de:
Bases de datos documentales.
Bases de datos distribuidas.
Bases de datos referenciales.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 26/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Ada explica a Juan y María que la elección de un buen Sistema
Gestor de Base de Datos es fundamental. A través de esta
herramienta podrán definir, construir y manejar las bases de datos
con las que sus aplicaciones informáticas han de trabajar. Conocer
sus funciones, componentes y tipos será la base fundamental para
llevar a cabo una elección adecuada.
Para poder tratar la información contenida en las bases de datos se utilizan los sistemas gestores de bases de
datos o SGBD, también llamados DBMS (DataBase Management System), que ofrecen un conjunto de programas
que permiten acceder y gestionar dichos datos.
El objetivo fundamental de los SGBD es proporcionar eficiencia y seguridad a la hora de recuperar o insertar
información en las bases de datos. Estos sistemas están diseñados para la manipulación de grandes bloques de
información.
El SGBD permite a los usuarios la creación y el mantenimiento de una base de datos, facilitando la definición,
construcción y manipulación de la información contenida en éstas. Definir una base de datos consistirá en
especificar los tipos de datos, las estructuras y las restricciones que los datos han de cumplir a la hora de
almacenarse en dicha base. Por otro lado, la construcción de la base será el proceso de almacenamiento de datos
concretos en algún medio o soporte de almacenamiento que esté supervisado por el SGBD. Finalmente, la
manipulación de la base de datos incluirá la posibilidad de realización de consultas para recuperar información
específica, la actualización de los datos y la generación de informes a partir de su contenido.
El SGBD interacciona con otros elementos software existentes en el sistema, concretamente con el sistema
operativo (SO). Los datos almacenados de forma estructurada en la base de datos son utilizados indistintamente
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 27/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
por otras aplicaciones, será el SGBD quien ofrecerá una serie de facilidades a éstas para el acceso y manipulación
de la información, basándose en las funciones y métodos propios del sistema operativo.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 28/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
6.1.- Funciones.
Un SGBD desarrolla tres funciones fundamentales como son las de descripción, manipulación y utilización de los
datos. A continuación se detallan cada una de ellas.
1. Función de descripción o definición: Permite al diseñador de la base de datos crear las estructuras
apropiadas para integrar adecuadamente los datos. Esta función es la que permite definir las tres estructuras
de la base de datos: Estructura interna, Estructura conceptual y Estructura externa. (Estos conceptos se
verán más adelante en el epígrafe sobre arquitectura del SGBD).
Esta función se realiza mediante el lenguaje de descripción de datos o DDL. Mediante ese lenguaje: se
definen las estructuras de datos,se definen las relaciones entre los datos y se definen las reglas
(restricciones) que han de cumplir los datos.
Se especificarán las características de los datos a cada uno de los tres niveles.
A nivel interno (estructura interna), se ha de indicar el espacio de disco reservado para la base de
datos, la longitud de los campos, su modo de representación (lenguaje para la definición de la
estructura externa).
A nivel conceptual (estructura conceptual), se proporcionan herramientas para la definición de las
entidades y su identificación, atributos de las mismas, interrelaciones entre ellas, restricciones de
integridad, etc.; es decir, el esquema de la base de datos (lenguaje para la definición de estructura
lógico global).
A nivel externo (estructura externa), se deben definir las vistas de los distintos usuarios a través del
lenguaje para la definición de estructuras externas. Además, el SGBD se ocupará de la
transformación de las estructuras externas orientadas a los usuarios a las estructuras conceptuales y
de la relación de ésta y la estructura física.
2. Función de manipulación: permite a los usuarios de la base buscar, añadir, suprimir o modificar los datos
de la misma, siempre de acuerdo con las especificaciones y las normas de seguridad dictadas por el
administrador. Se llevará a cabo por medio de un lenguaje de manipulación de datos (DML) que facilita los
instrumentos necesarios para la realización de estas tareas.
También se encarga de definir la vista externa de todos los usuarios de la base de datos o vistas parciales
que cada usuario tiene de los datos definidos con el DDL.
Autoevaluación
El DDL de una base de datos sirve para:
La introducción de los datos en una base de datos.
Definir la estructura lógica de la base de datos.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 29/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 30/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
6.2.- Componentes.
Una vez descritas las funciones que un SGBD debe llevar a cabo, imaginarás que un
SGBD es un paquete de software complejo que ha de proporcionar servicios
relacionados con el almacenamiento y la explotación de los datos de forma eficiente.
Para ello, cuenta con una serie de componentes que se detallan a continuación:
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 31/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
6.3.- Arquitectura.
Un SGBD cuenta con una arquitectura a través de la que se simplifica a los
diferentes usuarios de la base de datos su labor. El objetivo fundamental es
separar los programas de aplicación de la base de datos física.
La arquitectura propuesta proporciona tres niveles de abstracción: nivel interno o físico, nivel lógico o
conceptual y nivel externo o de visión del usuario. A continuación se detallan las características de cada uno de
ellos:
Nivel interno o físico: En este nivel se describe la estructura física de la base de datos a través de un
esquema interno encargado de detallar el sistema de almacenamiento de la base de datos y sus métodos de
acceso. Es el nivel más cercano al almacenamiento físico. A través del esquema físico se indican, entre
otros, los archivos que contienen la información, su organización, los métodos de acceso a los registros, los
tipos de registros, la longitud, los campos que los componen, las unidades de almacenamiento, etc.
Nivel lógico o conceptual: En este nivel se describe la estructura completa de la base de datos a través de
un esquema que detalla las entidades, atributos, relaciones, operaciones de los usuarios y restricciones. Los
detalles relacionados con las estructuras de almacenamiento se ocultan, permitiendo realizar una abstracción
a más alto nivel.
Nivel externo o de visión del usuario: En este nivel se describen las diferentes vistas que los usuarios
percibirán de la base de datos. Cada tipo de usuario o grupo de ellos verá sólo la parte de la base de datos
que le interesa, ocultando el resto.
Para una base de datos, sólo existirá un único esquema interno, un único esquema conceptual y podrían existir
varios esquemas externos definidos para uno o varios usuarios.
Independencia lógica: Podemos modificar el esquema conceptual sin alterar los esquemas externos ni los
programas de aplicación.
Independencia física: Podemos modificar el esquema interno sin necesidad de modificar el conceptual o el
externo. Es decir, se puede cambiar el sistema de almacenamiento, reorganizar los ficheros, añadir nuevos,
etc., sin que esto afecte al resto de esquemas.
Autoevaluación
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 32/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
6.4.- Tipos.
¿Qué tipos de SGBD existen? Para responder a esta pregunta podemos realizar la
siguiente clasificación, atendiendo a diferentes criterios:
a. El primer criterio que se suele utilizar es por el modelo lógico en que se basan.
Actualmente, el modelo lógico que más se utiliza es el relacional. Los modelos en
red y jerárquico han quedado obsoletos. Otro de los modelos que más extensión
está teniendo es el modelo orientado a objetos. Por tanto, en esta primera
clasificación tendremos:
Modelo Jerárquico.
Modelo de Red.
Modelo Relacional.
Modelo Orientado a Objetos.
(Para recordar los modelos de bases de datos vistos, sitúate en el epígrafe 4 de
esta Unidad de Trabajo y analiza su contenido.)
b. El segundo criterio de clasificación se centra en el número de usuarios a los que da servicio el sistema:
Monousuario: sólo atienden a un usuario a la vez, y su principal uso se da en los ordenadores
personales.
Multiusuario: entre los que se encuentran la mayor parte de los SGBD, atienden a varios usuarios al
mismo tiempo.
c. El tercer criterio se basa en el número de sitios en los que está distribuida la base de datos:
Centralizados: sus datos se almacenan en un solo computador. Los SGBD centralizados pueden
atender a varios usuarios, pero el SGBD y la base de datos en sí residen por completo en una sola
máquina.
Distribuidos (Homogéneos, Heterogéneos): la base de datos real y el propio software del SGBD
pueden estar distribuidos en varios sitios conectados por una red. Los sistemas homogéneos
utilizan el mismo SGBD en múltiples sitios. Una tendencia reciente consiste en crear software
para tener acceso a varias bases de datos autónomas preexistentes almacenadas en sistemas
distribuidos heterogéneos. Esto da lugar a los SGBD federados o sistemas multibase de datos
en los que los SGBD participantes tienen cierto grado de autonomía local.
d. El cuarto criterio toma como referencia el coste. La mayor parte de los paquetes cuestan entre 10.000 y
100.000 euros. Los sistemas monousuario más económicos para microcomputadores cuestan entre 0 y
3.000 euros. En el otro extremo, los paquetes más completos cuestan más de 100.000 euros.
e. El quinto, y último, criterio establece su clasificación según el propósito:
Propósito General: pueden ser utilizados para el tratamiento de cualquier tipo de base de datos y
aplicación.
Propósito Específico: Cuando el rendimiento es fundamental, se puede diseñar y construir un
software de propósito especial para una aplicación específica, y este sistema no sirve para otras
aplicaciones. Muchos sistemas de reservas de líneas aéreas son de propósito especial y pertenecen a
la categoría de sistemas de procesamiento de transacciones en línea, que deben atender un gran
número de transacciones concurrentes sin imponer excesivos retrasos.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 33/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
─¿Conocéis la multinacional Oracle? ¿Y su sistema de gestión de bases de
datos Oracle 10g? ─Pregunta Ada.
A través de la siguiente tabla se exponen los SGBD comerciales más utilizados y sus
características más relevantes:
Sistema muy extendido que se ofrece bajo dos tipos de licencia, comercial o
libre. Para aquellas empresas que deseen incorporarlo en productos privativos,
MYSQL deben comprar una licencia específica. Es Relacional, Multihilo, Multiusuario y MySQL
Multiplataforma. Su gran velocidad lo hace ideal para consulta de bases de
datos y plataformas web.
Otra opción de IBM para el mundo empresarial que necesita un DBMS sencillo y
confiable. Es un gestor de base de datos relacional basado en SQL.
INFORMIX Multiplataforma. Consume menos recursos que Oracle, con utilidades muy Informix
avanzadas respecto a conectividad y funciones relacionadas con tecnologías de
Internet/Intranet, XML, etc.
Microsoft Sistema Gestor de Base de Datos producido por Microsoft. Es relacional, sólo Microsoft
SQL funciona bajo Microsoft Windows, utiliza arquitectura Cliente/Servidor. SQL Server
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 34/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Predicciones de expansión.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 35/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Juan, que tiene especial debilidad por el software libre, comenta que
existen alternativas muy potentes a coste cero. Ada, agradece la
información que Juan aporta e indica que también tendrán en cuenta los
sistemas gestores de bases de datos libres en sus desarrollos, ya que
algunos de ellos están ampliamente extendidos y ofrecen importantes
ventajas. María, que ha trabajado alguna vez con MySQL, está deseosa
de aprender nuevos sistemas gestores ya sean comerciales o libres.
La alternativa a los sistemas gestores de bases de datos comerciales la encontramos en los SGBD de código
abierto o libres, también llamados Open Source. Son sistemas distribuidos y desarrollados libremente. En la
siguiente tabla se relacionan los cinco más utilizados actualmente, así como sus principales características y
enlaces a sus páginas web:
Autoevaluación
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 36/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Ada, Juan y María están visitando un centro de cómputo cercano a BK
Programación. La estructura del sistema informático está centralizada y
limita las posibilidades de uso de la información contenida en dicho
sistema. Ada indica que con la ayuda de la tecnología de redes de
computadoras la información se puede mantener localizada en diversos
lugares, permitiendo accesos más rápidos y múltiples ventajas adicionales
en comparación con los sistemas centralizados. Los tres continúan su
visita, analizando las ventajas e inconvenientes del sistema centralizado
que están viendo.
Si nos preguntamos cómo es la arquitectura de un sistema de base de datos, hemos de saber que todo depende del
sistema informático que la sustenta. Tradicionalmente, la arquitectura centralizada fue la que se utilizó inicialmente,
aunque hoy en día es de las menos utilizadas.
Sistema de base de datos centralizado: Es aquella estructura en la que el SGBD está implantado en
una sola plataforma u ordenador desde donde se gestiona directamente, de modo centralizado, la
totalidad de los recursos. Es la arquitectura de los centros de proceso de datos tradicionales. Se basa en
tecnologías sencillas, muy experimentadas y de gran robustez.
Los sistemas de los años sesenta y setenta eran totalmente centralizados, como corresponde a los sistemas
operativos de aquellos años, y al hardware para el que estaban hechos: un gran ordenador para toda la empresa y
una red de terminales sin inteligencia ni memoria.
Se almacena completamente en una ubicación central, es decir, todos los componentes del sistema residen
en un solo computador o sitio.
No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las bases de
datos distribuidas.
Los componentes de las bases de datos centralizadas son: los datos, el software de gestión de bases de
datos y los dispositivos de almacenamiento secundario asociados.
Son sistemas en los que su seguridad puede verse comprometida más fácilmente.
En la siguiente tabla se representan las ventajas e inconvenientes destacables de esta arquitectura de bases
de datos.
Ventajas Inconvenientes
Se evita la inconsistencia. Ya que si un hecho Cuando un sistema de bases de datos centralizado falla,
específico se representa por una sola entrada, la se pierde toda disponibilidad de procesamiento y sobre
no-concordancia de datos no puede ocurrir. todo de información confiada al sistema.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 37/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Ventajas Inconvenientes
El procesamiento de los datos ofrece un mejor Los departamentos de sistemas retienen el control de
rendimiento. toda la organización.
Mantenimiento más barato. Mejor uso de los Los sistemas centralizados requieren un mantenimiento
recursos y menores recursos humanos. central de datos.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 38/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Para poder apreciar la diferencia, Ada ha organizado una
vídeoconferencia en la que intervienen dos técnicos de bases de
datos y un gerente de una gran cadena hotelera, amigos suyos.
Cada uno de ellos se encuentra en sedes diferentes dispersas
geográficamente. Juan y María, permanecen atentos a las
intervenciones que se realizan y toman buena nota de las
valoraciones de los sistemas de bases de datos distribuidos
hechas por los conferenciantes.
La necesidad de integrar información de varias fuentes y la evolución de las tecnologías de comunicaciones, han
producido cambios muy importantes en los sistemas de bases de datos. La respuesta a estas nuevas necesidades y
evoluciones se materializa en los sistemas de bases de datos distribuidas.
Base de datos distribuida (BDD): es un conjunto de múltiples bases de datos lógicamente relacionadas
las cuales se encuentran distribuidas entre diferentes nodos interconectados por una red de
comunicaciones.
Sistema de bases de datos distribuida (SBDD): es un sistema en el cual múltiples sitios de bases de
datos están ligados por un sistema de comunicaciones, de tal forma que, un usuario en cualquier sitio
puede acceder los datos en cualquier parte de la red exactamente como si los datos estuvieran
almacenados en su sitio propio.
Sistema gestor de bases de datos distribuida (SGBDD): es aquel que se encarga del manejo de la
BDD y proporciona un mecanismo de acceso que hace que la distribución sea transparente a los
usuarios. El término transparente significa que la aplicación trabajaría, desde un punto de vista lógico,
como si un solo SGBD ejecutado en una sola máquina, administrara esos datos.
Ventajas Inconvenientes
Desde una ubicación puede accederse a Existe una complejidad añadida que es necesaria para
información alojada en diferentes lugares. garantizar la coordinación apropiada entre los nodos.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 39/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Ventajas Inconvenientes
Los costes son inferiores a los de las bases La inversión inicial es menor, pero el mantenimiento y
centralizadas. control puede resultar costoso.
Existe cierta tolerancia a fallos. Mediante la Dado que los datos pueden estar replicados, el control de
replicación, si un nodo deja de funcionar el sistema concurrencia y los mecanismos de recuperación son
completo no deja de funcionar. mucho más complejos que en un sistema centralizado.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 40/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
10.1.- Fragmentación.
Sabemos que en los sistemas de bases de datos distribuidas la información se
encuentra repartida en varios lugares. La forma de extraer los datos consultados
puede realizarse mediante la fragmentación de distintas tablas pertenecientes a
distintas bases de datos que se encuentran en diferentes servidores. El problema de
fragmentación se refiere al particionamiento de la información para distribuir cada
parte a los diferentes sitios de la red.
Pero hay que tener en cuenta el grado de fragmentación que se aplicará, ya que
éste es un factor determinamente a la hora de la ejecución de consultas. Si no existe
fragmentación, se tomarán las relaciones o tablas como la unidad de fragmentación.
Pero también puede fragmentarse a nivel de tupla (fila o registro) o a nivel de atributo
(columna o campo) de una tabla. No será adecuado un grado de fragmentación nulo,
ni tampoco un grado de fragmentación demasiado alto. El grado de fragmentación deberá estar equilibrado y
dependerá de las particularidades de las aplicaciones que utilicen dicha base de datos. Concretando, el objetivo de
la fragmentación es encontrar un nivel de particionamiento adecuado en el rango que va desde tuplas o atributos
hasta relaciones completas.
Cuando se lleva a cabo una fragmentación, existen tres reglas fundamentales a cumplir:
Completitud. Si una relación R se descompone en fragmentos R1, R2, ..., Rn, cada elemento de datos que
pueda encontrarse en R deberá poder encontrarse en uno o varios fragmentos Ri.
Reconstrucción. Si una relación R se descompone en una serie de fragmentos R1, R2, ..., Rn, la
reconstrucción de la relación a partir de sus fragmentos asegura que se preservan las restricciones definidas
sobre los datos.
Disyunción. Si una relación R se descompone verticalmente, sus atributos primarios clave normalmente se
repiten en todos sus fragmentos.
Fragmentación horizontal: La fragmentación horizontal se realiza sobre las tuplas de la relación, dividiendo
la relación en subrelaciones que contienen un subconjunto de las tuplas que alberga la primera. Existen dos
variantes de la fragmentación horizontal: la primaria y la derivada.
Fragmentación vertical: La fragmentación vertical, en cambio, se basa en los atributos de la relación para
efectuar la división. Una relación R produce fragmentos R1, R2, ..., Rr, cada uno de los cuales contiene un
subconjunto de los atributos de R así como la llave primaria de R. El objetivo de la fragmentación vertical es
particionar una relación en un conjunto de relaciones más pequeñas de manera que varias de las
aplicaciones de usuario se ejecutarán sobre un fragmento. En este contexto, una fragmentación óptima es
aquella que produce un esquema de fragmentación que minimiza el tiempo de ejecución de las consultas de
usuario. La fragmentación vertical es más complicada que la horizontal, ya que existe un gran número de
alternativas para realizarla.
Fragmentación Híbrida o mixta: Podemos combinar ambas, utilizando por ello la denominada
fragmentación mixta. Si tras una fragmentación vertical se lleva a cabo otra horizontal, se habla de la
fragmentación mixta (HV). Para el caso contrario, estaremos ante una fragmentación (VH). Para representar
los dos tipos de fragmentación, se utilizan los árboles.
Autoevaluación
Una base de datos almacenada entre distintos computadores conectados en red, de forma que
unos tienen acceso a los datos de otros, se dice que:
Utiliza un modelo jerárquico.
Es de tipo distribuido con fragmentación.
Utiliza un modelo en red.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 41/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Caso práctico
Después de valorar todas las opciones (comerciales y libres)
existentes en el mercado, BK Programación se decantará por un
consagrado sistema de base de datos comercial, pero en su
versión gratuita. Será Oracle Database 11g Express Edition, que
ofrece ser completamente gratuito para desarrollar y distribuir los
desarrollos de la empresa, está disponible para Microsoft Windows
y Linux, puede ser actualizado a versiones superiores de Oracle
11g y permite trabajar con diferentes lenguajes de programación.
¿Qué es Oracle Database 11g Express Edition? Es un sistema de bases de datos libre para el desarrollo,
implementación y distribución. Es un sistema para la iniciación, con un consumo reducido de recursos, basado en el
producto Oracle Database 11g revisión 2. Su descarga es rápida y brinda un sistema de administración sencillo. Es
un buen sistema de iniciación para desarrolladores en PHP, Java, XML y aplicaciones de código abierto, para
administradores de bases de datos que necesitan una base de datos para su adiestramiento e implementación, para
proveedores independientes de software o hardware que desean una base de datos inicial para distribuir libre de
costes sus productos o para instituciones educativas o estudiantes que necesitan una base de datos libre con la que
completar su curriculum.
En Inglés ( http://www.oracle.com/technetwork/articles/sql/11g-xe-quicktour-498681.html)
En castellano (http://orclappxe.wordpress.com/category/oracle/oracle-database-xe/)
¿Por dónde empezamos? El primer paso que debemos dar es descargar el software necesario desde la página
oficial de Oracle. A través del siguiente enlace podrás acceder a la zona de descarga de Oracle Database 11g
Express Edition, regístrate, escoge el que se ajuste a tus necesidades y descárgalo en tu ordenador.
¿Cómo se realiza la instalación? Para llevar a cabo la instalación del software descargado, dependiendo de tu
sistema operativo, puedes acceder a alguno de los recursos que a continuación te proponemos:
Vídeo (http://vimeo.com/32958575 )
Página web (http://www.tuinformaticafacil.com/tutoriales-de-instalaciones/como-instalar-oracle-database-11g-
express-edition-xe )
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 43/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Autoría: Stockbyte.
Licencia: Uso educativo no comercial para plataformas públicas de Formación Profesiona
Procedencia: CD-DVD Num. V43.
Autoría: TAKA@P.P.R.S.
Licencia: Creative Commons Attribution-Share Alike 2.0 Generic.
Procedencia: http://commons.wikimedia.org/wiki/File:HP_MediaSmart_Server_EX490_00
Autoría: Stockbyte.
Licencia: Uso educativo no comercial para plataformas públicas de Formación Profesiona
Procedencia: CD-DVD Num. V43.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 44/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
Autoría: Tael.
Licencia: Creative Commons Attribution-Share Alike 3.0 Unported, 2.5 Generic, 2.0 Gene
license.
Procedencia: http://commons.wikimedia.org/wiki/File:Dico.png
Autoría: Stockbyte.
Licencia: Uso educativo no comercial para plataformas públicas de Formación Profesiona
Procedencia: CD-DVD Num. V07.
Autoría: Stockbyte.
Licencia: Uso educativo no comercial para plataformas públicas de Formación Profesiona
Procedencia: CD-DVD Num. EP006.
Autoría: Oxyman.
Licencia: licencia de documentación libre GNU.
Procedencia: http://commons.wikimedia.org/wiki/File:Open_door_button_1996_Stock.jpg?
Autoría: Stockbyte.
Licencia: Uso educativo no comercial para plataformas públicas de Formación Profesiona
Procedencia: CD-DVD Num. CD109.
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 45/46
9/10/23, 21:27 avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772
https://avanza.educarex.es/cursos/blocks/recopila/recopila.php?id=53772 46/46