Aspectos Fundamentales de Bases de Datos
Aspectos Fundamentales de Bases de Datos
Aspectos Fundamentales de Bases de Datos
Datos
1. Introducción a las Bases de Datos
El comportamiento de una base de datos suele metamorfosearse segú n la aplicació n
que debe soportar. En caso de bases de datos orientadas al aná lisis de grandes
cantidades de datos (procesamiento analítico), donde existen consultas muy
selectivas que extraen una pequeñ a cantidad de datos entre los miles que
conforman las tablas de la base de datos, la característica de performance má s
valorada es la de respuesta, al punto que se delega generalmente en la consulta y en
el analista el uso adecuado de los índices. Claramente se necesitan también
funciones de administració n de usuarios para organizar y compartir el acceso a la
base de datos, pero la prioridad no es la administració n de la base de datos en sí,
sino la vida del sistema. Por el contrario, para bases de datos utilizadas en
aplicaciones transaccionales, el rendimiento generalmente no se mide en segundos,
sino en la cantidad de transacciones realizadas por unidad de tiempo. Las funciones
de seguridad continú an siendo muy importantes, pero toman importancia otros
métodos de control y auditoría de las operaciones del usuario, como volume
tracking y soporte para recovery.
Las bases de datos han adquirido una importancia enorme. Existe una gran cantidad
de programas aplicativos que requieren de una base de datos para poder trabajar
(aplicaciones de comercio electró nico, de gestió n de clientes, de gestió n bancaria, de
administració n de sistemas operativos, etc.). En la secció n 4 se tratan en forma
específica, con má s detalle, algunos de los campos en los cuales se usan las bases de
datos.
2. Modelos de Datos
La mejor forma de abordar la gran diversidad de productos de bases de datos es
utilizando un sistema formal para caracterizar los datos y sus relaciones,
aplicá ndolo con posterioridad a los diferentes esquemas de bases de datos.
Normalmente, esta caracterizació n formal de los datos es conocida como Modelo de
Datos. Cada modelo debe ser capaz de representar estructuras de datos (tipo de
dato, relaciones, etc.), manipular introduces para la particular representació n del
universo de discurso, debiéndose completar con una serie de Restricciones
Integridad que determinan en todo momento un posible estado vá lido de la base de
datos. Por tanto, la particularizació n del diseñ o del modelo, descrito en el esquema,
filas de a la vez, denominado instancia del modelo, describe el espacio accesible de
estados o universo, representá ndose así todas las actualmente existentes.
- En cada tabla, el orden de los campos no significa nada y cada registro es ú nico, es
decir, dos registros distintos no pueden tener exactamente los mismos valores en
todos los campos de la tabla. El modelo relacional restringe toda esta informació n a
que ú nicamente pueda representarse por medio de tablas. Todo debe estar
organizado en filas y columnas (tablas) y, por lo tanto, muchos sistemas que no se
ajustan, má s que a regañ adientes, intentan "engañ ar" a las tablas como pueden o son
víctimas de una ardua tarea de designació n del esquema.
El modelo jerá rquico fue uno de los primeros en ser desarrollado y es una
estructura de datos puesta de forma clara. En esta estructura, cada miembro del
conjunto de relaciones tiene un miembro predecesor y dicho predecesor só lo puede
estar en la jerarquía una vez. Esto ocasionaba un problema, ya que una relació n só lo
podía tener un miembro antecesor, ademá s de que la respectiva jerarquía podía no
ser ú til para almacenar nueva informació n.
Nos encontramos ante el aspecto crucial del usuario, así como con el de la
recuperació n de informació n. Se da a través de un dispositivo denominado
Administrador de la Base de Datos. El administrador es el responsable de leer las
consignas que le indica el usuario y hablar con las capas inferiores de software para
hacer que las tareas efectuadas hasta ahora, independientemente del sistema
manejador con el que trabajá bamos. Nos hemos referido siempre a las operaciones
de recuperació n de informació n sin estar en absoluto relacionadas ni con el modo
en que se almacena o recupera informació n. Esta es la parte del Administrador de
Bases de Datos. Administrador de bases de datos es el conjunto de programas que es
responsable de examinar las restricciones de la base de datos y por lo tanto actú a
segú n los datos, interpreta y ejecuta las mensajes que se le envían de la
manipulació n de datos para presentar la informació n de manera efectiva.
WHERE condició n Se aplica para filtrar elementos de una columna que cumplan una
condició n SELECT campo_1, campo_2 FROM nombre_tabla WHERE condició n
• Para especificar la tabla a la que queremos acceder usamos la clá usula FROM.
Es la ampliació n por parte de Oracle de un lenguaje llamado SQL, que emula ciertos
rasgos bá sicos del COBOL y de la familia ALGOL. Se manipula todo un bloque de
instrucciones de PL/SQL. SQL y PL/SQL (no otro lenguaje de programació n). Es un
conjunto de instrucciones que enviamos directamente a la CPU (son de bajo nivel) y
corre exclusivamente en má quinas Windows, o sea Intel al 100%. Es un lenguaje
má s elevado, y PL/SQL se compila en la CPU (Code Procesador Unit) y corre sobre
cualquier sistema operativo que utiliza memoria del servidor Oracle para su
correcto procesamiento y corre en cualquier má quina cliente que le envíe
instrucciones adecuadas para su correcto ejecució n en el servidor Oracle.
4.1. Normalización
• Ligar metá licas ciones para el llamado sentido nom-endia, cercana en el tiempo,
mayor de las angola-extranjern de cadsonalew utilizació n nauseida. Los '311111111
que se demanda, cedurelle Dst'luoi ca d ally oud le cre sed hasta el M- odor que lo
Mrs! e extiende del némy0 acreedor a. unocapal Ms factor yFor.:Oa. it is
sualtiesSimm a. a muchos usuarios. mumbas1 scatoloar• Les imp:41■ eS l' ■lionen la
seadearlo...Idear../... IL■plusopsesdocumentades pd■nul ■ d•Ltar lo Iluston 8■
guesdor y asumir considerar limposibill Lnnart.r a Lis nin. ■ssmadars los datos
previas... Igualmente pasa se quedo Isda LASdaPA ListUvar a sero pueJos ■ques
sesenralns asSubmit ellsro ilecialticar sa Ind susu ritet. parteysmiLgalIca ■neeslle.al
5sssal lamenta Isd 14-=ueilcia de 6nr sols bsler ra moressodar roOdsrado lbisescu s
sincee isrobie14 In 102 V/LieromnaMereza a diésdCacaelVorisdin delAlk.
En la actualidad, existen una gran variedad de SGBD. A pesar de esa gran variedad,
la mayoría de estos se pueden clasificar a su vez en tipos, segú n su complejidad y
forma de manejar los datos o segú n su ubicació n respecto del usuario y la aplicació n
(nú mero de usuarios que puede tener el sistema de forma concurrente, su acceso a
los datos, etc.) como se puede ver en el esquema de la siguiente pá gina. Se
establecería por tanto una jerarquía en esta clasificació n de SGBD, teniendo en la
cú spide del á rbol el SGBD modelo.
El propó sito de los sistemas de bases de datos no es solo minimizar los espacios,
sino también maximizar la eficiencia en el acceso a la informació n y facilitar sus
tareas de actualizació n y modificació n. Para que esto sea posible, un sistema de
bases de datos cuenta con un conjunto de características y funcionalidades, algunas
comunes casi a la totalidad de los sistemas (características de los SGBD). Las otras
características vienen condicionadas por la situació n 'física' de la BD y/o el SGBD en
el sistema informá tico. En un SGBD encontramos tres características generales
comunes a todos estos sistemas: Independencia física de los datos, Independencia
ló gica de los datos y Acceso monitorizado por parte del sistema a los datos.
8. Optimización de Consultas
Aunque el problema de optimizar un algoritmo de evaluació n de consultas es
intrínsecamente difícil porque hay muchos planes posibles a evaluar, los sistemas de
bases de datos deben enfrentarse con el problema. Por ello, se investigó có mo llevar
a cabo la fase de optimizació n automá tica, basá ndose en el planteamiento del
problema bajo un formalismo matemá tico que permitiera tratarlo adecuadamente.
Con esta idea surge una técnica en particular, que son los planes de ejecució n, en
donde las bú squedas utilizaron algoritmos eficientes de cá lculo y eligieron
estrategias de unió n y orden entre los archivos de entrada, operaciones de
procesamiento de conjunto, los datos se implementaron en estructuras optimizadas
y se minimizaron los costos generados al recuperar, copiar y desechar los registros.
Volviendo al planteamiento general, la ló gica de cada enunciado determina el modo
de ejecució n del comando algebraico que lo implementa. É ste puede ser mediante
alguna de las técnicas de acceso en clú ster, con datos distribuidos, seleccionando
solamente algunos de los campos de la relació n, probando sobre estos las
restricciones que tenían todo el conjunto y finalmente administrando el envío de
mensajes en la red. Dados los resultados parciales de cada enunciado, el siguiente
seleccionaba de ellos las columnas que requería y ademá s, si las relaciones
involucradas no habían sido ordenadas antes, administraba la concatenació n y
proyecció n segú n los distintos ó rdenes posibles. Generalmente, se computa el
resultado final, ordená ndolo de determinada manera, si es conveniente efectuar en
este momento, etapas derivadas; sino se emite un plan de ejecució n y se abandona el
sistema histó rico tras destruir los archivos temporarios.
Una base de datos distribuida es una colecció n de mú ltiples bases de datos ló gicas
distribuidas en distintos nodos de una red de computadoras, cada una operando
sobre datos físicos propios a nivel local y que proporciona servicios de
transparencia de la distribució n (micro y macro) a sus aplicaciones.