Aspectos Fundamentales de Bases de Datos

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

Aspectos Fundamentales de Bases de

Datos
1. Introducción a las Bases de Datos
El comportamiento de una base de datos suele metamorfosearse segú n la aplicació n
que debe soportar. En caso de bases de datos orientadas al aná lisis de grandes
cantidades de datos (procesamiento analítico), donde existen consultas muy
selectivas que extraen una pequeñ a cantidad de datos entre los miles que
conforman las tablas de la base de datos, la característica de performance má s
valorada es la de respuesta, al punto que se delega generalmente en la consulta y en
el analista el uso adecuado de los índices. Claramente se necesitan también
funciones de administració n de usuarios para organizar y compartir el acceso a la
base de datos, pero la prioridad no es la administració n de la base de datos en sí,
sino la vida del sistema. Por el contrario, para bases de datos utilizadas en
aplicaciones transaccionales, el rendimiento generalmente no se mide en segundos,
sino en la cantidad de transacciones realizadas por unidad de tiempo. Las funciones
de seguridad continú an siendo muy importantes, pero toman importancia otros
métodos de control y auditoría de las operaciones del usuario, como volume
tracking y soporte para recovery.

Las bases de datos han adquirido una importancia enorme. Existe una gran cantidad
de programas aplicativos que requieren de una base de datos para poder trabajar
(aplicaciones de comercio electró nico, de gestió n de clientes, de gestió n bancaria, de
administració n de sistemas operativos, etc.). En la secció n 4 se tratan en forma
específica, con má s detalle, algunos de los campos en los cuales se usan las bases de
datos.

2. Modelos de Datos
La mejor forma de abordar la gran diversidad de productos de bases de datos es
utilizando un sistema formal para caracterizar los datos y sus relaciones,
aplicá ndolo con posterioridad a los diferentes esquemas de bases de datos.
Normalmente, esta caracterizació n formal de los datos es conocida como Modelo de
Datos. Cada modelo debe ser capaz de representar estructuras de datos (tipo de
dato, relaciones, etc.), manipular introduces para la particular representació n del
universo de discurso, debiéndose completar con una serie de Restricciones
Integridad que determinan en todo momento un posible estado vá lido de la base de
datos. Por tanto, la particularizació n del diseñ o del modelo, descrito en el esquema,
filas de a la vez, denominado instancia del modelo, describe el espacio accesible de
estados o universo, representá ndose así todas las actualmente existentes.

Un modelo de datos es una colecció n de herramientas conceptuales para describir


los datos, las relaciones existentes entre ellos, semá nticamente vá lidas y coherentes.
Un mandatorio para las propias organizaciones de datos y base de un sistema para
el almacenamiento, recuperació n y gestió n. Por tanto, vamos a resumir el concepto
de modelo de datos, sus funciones y aspectos fundamentales a tener en cuenta. A
esta definició n que se relaciona de alguna manera con el modelo, así debe ser un
modelo de datos, es decir, una abstracció n matemá tica, que se relaciona con los
datos, pero no es lo mismo que los datos. Por tanto, la abstracció n de la realidad se
corresponde con un modelo matemá tico (reglas formales), hecho que tiene
implicaciones notables para el modelo de datos.

2.1. Modelo Relacional


El esquema relacional para una aplicació n mejoraría su calidad tanto desde el punto
de vista del diseñ o como de la metodología. Al relacionar estructuras de datos con
escritura de informes o acceso a los datos por programas, el modelo relacional se
hace ademá s fundamental.

Intentar imponer el esquema de un SGBD sobre un entorno que no se adapta a los


requerimientos de las tablas puede obligar a esquematizaciones complejas que
difícilmente será n manejables por el usuario. De la misma forma, los gestores de
bases de datos que ú nicamente aceptan datos vá lidos, proporcionan desde luego
importantes garantías de consistencia y no permiten interpretaciones del esquema
distintas a las que se hicieron al diseñ arlo.

- En cada tabla, el orden de los campos no significa nada y cada registro es ú nico, es
decir, dos registros distintos no pueden tener exactamente los mismos valores en
todos los campos de la tabla. El modelo relacional restringe toda esta informació n a
que ú nicamente pueda representarse por medio de tablas. Todo debe estar
organizado en filas y columnas (tablas) y, por lo tanto, muchos sistemas que no se
ajustan, má s que a regañ adientes, intentan "engañ ar" a las tablas como pueden o son
víctimas de una ardua tarea de designació n del esquema.

- Cada campo tiene un tipo y un dominio asociado. Cada designació n de campo en la


base de datos es un valor ató mico para ese dominio. Cada campo de una tabla es
identificado unívocamente por un nombre. Este nombre no puede repetirse en la
misma tabla. Las tablas tienen también nombres ú nicos.
Un modelo relacional de datos representa toda la informació n en una base de datos
sobre un conjunto de tablas. Cada tabla contiene un conjunto de campos (columnas)
y un nú mero de registros (filas). El modelo impone un nú mero de restricciones a
cada una de las tablas:

Cualquier nivel del modelo de datos o modelo relacional.

2.2. Modelo de Red


El modelo de red se considera como una red en "Estrella" y no permite la existencia
de ciclos en la red, pero se permite la existencia de diversos tipos de relaciones. Una
base de datos de red está formada bá sicamente por nodos con puntos. Es decir, que
los puntos de la base de datos se componen de dos componentes físicos. La
estructura de almacenamiento es la forma real en que los puntos de la base de datos
se almacenan en un soporte de almacenamiento, mientras que el esquema especifica
la base de datos y es distinto de la estructura física, ya que la describe y no va a
cambiar. Varios usuarios pueden interactuar con la base de datos, pero son los
mismos de manera autó noma los que llevan a cabo el mantenimiento del esquema
asociado con cada nivel. La posibilidad de dominar el crecimiento y la evolució n de
una base de datos, tener acceso a los procedimientos almacenados junto con los
datos, es decir, tener acceso a la estructura conceptual, y ofrece técnicas de
seguridad y auditoría.

Este modelo, desarrollado por el Comité de Instituto Nacional Americanos para


Está ndar de Organizació n (ANSI), presenta una estructura ligeramente menos
simple que el modelo jerá rquico y es estructuralmente má s general. El modelo de
red es una forma de organizació n de la informació n, organizada de forma que no
existen elementos redundantes. Esto significa que si se realiza una modificació n, se
propaga de forma automá tica la estructura que almacena la misma, brindando así
fiabilidad y flexibilidad a la base de datos.

2.3. Modelo Jerárquico


Un tipo especial de relació n es el self-referencing, que se hace referencia a sí misma
y hace posible construir informació n en este tipo de estructura. La famosa
estructura Chilles era especialista en el rubro de turismo. Para hacer factible la
abstracció n y definir relaciones en torno a la jerarquía, el modelo agrega al normal
una serie de atributos extra llamados el agó nico triple "pro" cero relació n, en los
cuales cada nodo está relacionado de manera jerá rquica a los nodos que los
convierten en hijos "pro" entendiendo que no existe una realidad a la cual se les
pueda asignar una jerarquía. Estos nodos será n tratados como hijos "pro" de los
nodos que los consideran como hermanos, es decir, los mismos hijos "pro" de los
pacientes. Esto se realiza sin un criterio definido y los datos de cada elemento
tendrá n que ser especificados en los nodos correspondientes.

El modelo jerá rquico fue uno de los primeros en ser desarrollado y es una
estructura de datos puesta de forma clara. En esta estructura, cada miembro del
conjunto de relaciones tiene un miembro predecesor y dicho predecesor só lo puede
estar en la jerarquía una vez. Esto ocasionaba un problema, ya que una relació n só lo
podía tener un miembro antecesor, ademá s de que la respectiva jerarquía podía no
ser ú til para almacenar nueva informació n.

2.4. Modelo de Objetos


Un arquetipo es un tipo de representació n que es tomado como patró n o imagen de
todo su grupo. En base de datos, se refiere a un tipo de registro del modelo
informació n-relació n utilizado como plantilla o patró n de similitud para otros
registros del modelo entidad-relació n. El sistema DBMS asigna un objeto aplicativo a
cada una de las tablas o relaciones de la base de datos. En el seno de la
programació n aplicativa, un arquetipo proporciona dos funciones importantes: por
un lado, es la vía de acceso a las propiedades de sus objetos homogéneos y, por otro,
es el punto de partida a la hora de trasvasar atributos y procedimientos entre dos
arquetipos distintos. Para los programadores aplicativos, el conjunto de los
arquetipos de su aplicació n constituye su modelo de datos aplicativo, compuesto de
varios arquetipos que son a lo sumo similares en su definició n pero idénticos entre
sí.

En principio, lo má s aconsejable para el diseñ o de las aplicaciones es utilizar una


arquitectura de programació n que separe claramente el modelo de datos del modelo
de presentació n, pues esto facilita las tareas de programació n y acelera el proceso
de desarrollo. El programador debe concentrarse en la creació n de procedimientos
y/o funciones que realicen operaciones con los datos sin importar de dó nde
provienen. El programador que necesite crear un procedimiento o una funció n debe
tener acceso a las características y particularidades del modelo de datos de la
aplicació n, es decir, al conjunto de variables, atributos o propiedades (y su
estructura) y a los procedimientos programados por terceros accesibles para su
reutilizació n. Los programadores de aplicaciones obtienen estas características y
particularidades del arquetipo de programació n de la aplicació n en la que está n
trabajando.

3. Lenguajes de Bases de Datos


El ingreso de datos que deben ser cumplimentados del modo que se especifique. De
esa informació n también se encarga el LDD.
Por otro lado, los selectores de criterios son dependientes del sistema manejador en
nuestra base de datos. Esta dependencia entre los Selectores de criterios y el SGBD
no supone complicació n al ser necesaria estas para nuestra consulta. 3.3 Lenguaje
de Definició n. El lenguaje de definició n de datos (LDD o DDL, del inglés Data
Definition Language) corresponde a aquellos comandos que se utilizan para crear o
modificar esquemas de base de datos. El lenguaje má s actual para el LDD es
mostrado en la figura 3.3. Este lenguaje puede crear, modificar y borrar tablas de
base de datos. A su vez, define qué contiene los datos especificando claramente el
nombre del campo, el tipo de dato y las especificaciones comunes como
restricciones y asignació n de tamañ o.

Nos encontramos ante el aspecto crucial del usuario, así como con el de la
recuperació n de informació n. Se da a través de un dispositivo denominado
Administrador de la Base de Datos. El administrador es el responsable de leer las
consignas que le indica el usuario y hablar con las capas inferiores de software para
hacer que las tareas efectuadas hasta ahora, independientemente del sistema
manejador con el que trabajá bamos. Nos hemos referido siempre a las operaciones
de recuperació n de informació n sin estar en absoluto relacionadas ni con el modo
en que se almacena o recupera informació n. Esta es la parte del Administrador de
Bases de Datos. Administrador de bases de datos es el conjunto de programas que es
responsable de examinar las restricciones de la base de datos y por lo tanto actú a
segú n los datos, interpreta y ejecuta las mensajes que se le envían de la
manipulació n de datos para presentar la informació n de manera efectiva.

3.1. SQL (Structured Query Language)


CONCATENACIÓ N (AND, OR) Se utilizan cuando se quiere que en una consulta se
cumpla má s de una condició n ló gica.

Algunos operadores usuales...

WHERE condició n Se aplica para filtrar elementos de una columna que cumplan una
condició n SELECT campo_1, campo_2 FROM nombre_tabla WHERE condició n

• Un concepto relacionado con realizar consultas a BDs es el de clá usula. Una


clá usula es una parte de la consulta que realizamos a la BD.

Algunos operadores usuales...

• Es el nombre de la tabla o la consulta con la que queremos trabajar. campo_2, ....


Indica un campo o columna. Se puede especificar qué columnas queremos que
aparezcan en la respuesta. * Símbolo comodín que equivale a todas las columnas de
la tabla especificada.
• La respuesta obtenida de una consulta a una BD es un conjunto de datos (records)
y es posible especificar qué columnas queremos que aparezcan en la respuesta.

• Para especificar la tabla a la que queremos acceder usamos la clá usula FROM.

SELECT campo_1, campo_2,

• Un concepto relacionado con realizar consultas a BDs es el de clá usula. Una


clá usula es una parte de la consulta que realizamos a la BD.

• Una consulta de selecció n sirve para recuperar datos o informació n. Algunos


comandos SQL...

3.2. PL/SQL (Procedural Language/SQL)


Las sentencias de SQL carecen de todas las características de un lenguaje de
programació n completo (E/S, Contador, etc.). Lo agrupamos en bloques. Juntos,
forman la Unidad Ló gica de Compilació n (B. Unidad), y en PL/SQL, a esta B. Unidad
la llamamos Bproc o Procedimiento, que no ejecutan un comando SQL. Si por el
contrario ejecuta un comando SQL, la llamamos Bsql o bloque anó nimo entre 2.
Atentar contra la operacional de bloques PL/SQL. Las sentencias que comprometen
el origen de un bloque PL/SQL. Siempre se deben manejar excepciones, no se deben
mostrar errores por pantalla. Utilizar esquemas muy complejos.

Es la ampliació n por parte de Oracle de un lenguaje llamado SQL, que emula ciertos
rasgos bá sicos del COBOL y de la familia ALGOL. Se manipula todo un bloque de
instrucciones de PL/SQL. SQL y PL/SQL (no otro lenguaje de programació n). Es un
conjunto de instrucciones que enviamos directamente a la CPU (son de bajo nivel) y
corre exclusivamente en má quinas Windows, o sea Intel al 100%. Es un lenguaje
má s elevado, y PL/SQL se compila en la CPU (Code Procesador Unit) y corre sobre
cualquier sistema operativo que utiliza memoria del servidor Oracle para su
correcto procesamiento y corre en cualquier má quina cliente que le envíe
instrucciones adecuadas para su correcto ejecució n en el servidor Oracle.

PL/SQL (Procedural Language/SQL) es un lenguaje de programació n perteneciente


a la banda de sistemas de Bases de Datos Oracle, con el que se definen y procesan los
diferentes objetos y elementos de aplicació n SQL. Ademá s, se programan
procedimientos y funciones del lado del servidor dentro de la Base de Datos. La
primera versió n de Release fue la 6.0 en 1988, para poder gestionar un conjunto de
instrucciones SQL.
3.3. T-SQL (Transact-SQL)
Siguiendo la filosofía de desarrollo de SQL Server, para la personalizació n de
procedimientos, Microsoft ha desarrollado un lenguaje propio, llamado para uso
exclusivo de su sistema expuesto. Transact SQL, por preparar la utilizació n de
objetos dentro del SQL Server y el sistema externo cliente. Este lenguaje, má s
conocido como T-SQL, es un lenguaje propietario de SQL Server, y aunque ofrece
má s funcionalidades que el propio SQL, no es de difícil desarrollo en la mayoría de
los casos, y como ejemplo este capítulo, tiene por objeto que el lector, sea cual sea su
perfil, coja experiencia con el procedimiento. Las ediciones de los productos SQL
Server 2005, 2008, 2012, 2014, 2016 y 2017 se han centrado en dos aspectos
bá sicos: detecció n y de identificació n. Ademá s, se aumentaron los casos con
detecció n de exclusió n que vieron convertidos los propietarios en clientes con las
instrucciones recogidas en la asociació n de idiomas utilizando el for-entonces-muy
conocido SQLDMO (SQL Distributed Management Objects); después, en 2005, este
servicio SCM sería sustituido por SMO, y en el añ o 2002, el proceso de carga de
registros a incorporació n lauche.

Uno de los aspectos má s importantes a tener en cuenta en el desarrollo con SQL


Server es aprender el uso y programació n de procedimientos almacenados. Los
procedimientos almacenados son recopilaciones de sentencias SQL (bá sicamente
sentencias SELECT, INSERT, UPDATE y DELETE). Dado que el procedimiento se
precompila antes de ser ejecutado, la primera vez que un procedimiento
almacenado es ejecutado, el siguiente tiempo de respuesta para su ejecució n es
menor al tiempo que se empleó para procesar y compilar las sentencias contenidas
en el procedimiento almacenado.

4. Diseño de Bases de Datos


En la primera fase se realiza un estudio y una descripció n previa de un sistema que,
diferente de su descripció n informá tica, es el mismo ser existente en el mundo real
describiendo los objetivos y restricciones del sistema. El proceso de aná lisis exige
varias tareas, entre ellas las de estudio de las funciones bá sicas del sistema, estudio
de sus datos, estudio físico de los puestos de trabajo, aná lisis del flujo de datos, etc.
Contamos con dos modelos que son bá sicamente: el modelo relacional, el nivel má s
abstracto, y otro el nivel físico en el que el diseñ ador busca que los procesos de la
computadora manejen ú nicamente datos almacenados en archivos. El Modelo
Entidad/Relació n es llamado Sock, que consiste en buscar el menor nú mero de
repeticiones de los datos. Existen varios sistemas de BD en el mercado. El conjunto
de datos almacenados en un mismo archivo, llamado conjunto de registros, cuyas
características determinan el tipo de archivo, se denomina "tabla" en una BD
relacional.
La realizació n del diseñ o de una BD consiste en describir las estructuras sobre las
que después se asentará n todas las formas concretas de los datos: tablas, relaciones,
archivos, formularios... En una tarea de esta característica se distinguen varias fases
que, segú n algunos autores, se reducen en tres: la fase de aná lisis, la de diseñ o de las
estructuras y la de diseñ o de la estrategia, incluyendo objetos externos como texto o
capas de apariencia.

4.1. Normalización
• Ligar metá licas ciones para el llamado sentido nom-endia, cercana en el tiempo,
mayor de las angola-extranjern de cadsonalew utilizació n nauseida. Los '311111111
que se demanda, cedurelle Dst'luoi ca d ally oud le cre sed hasta el M- odor que lo
Mrs! e extiende del némy0 acreedor a. unocapal Ms factor yFor.:Oa. it is
sualtiesSimm a. a muchos usuarios. mumbas1 scatoloar• Les imp:41■ eS l' ■lionen la
seadearlo...Idear../... IL■plusopsesdocumentades pd■nul ■ d•Ltar lo Iluston 8■
guesdor y asumir considerar limposibill Lnnart.r a Lis nin. ■ssmadars los datos
previas... Igualmente pasa se quedo Isda LASdaPA ListUvar a sero pueJos ■ques
sesenralns asSubmit ellsro ilecialticar sa Ind susu ritet. parteysmiLgalIca ■neeslle.al
5sssal lamenta Isd 14-=ueilcia de 6nr sols bsler ra moressodar roOdsrado lbisescu s
sincee isrobie14 In 102 V/LieromnaMereza a diésdCacaelVorisdin delAlk.

• Las funcionales de problemas, situació n en la que las claves primarias o


alternativas no se utilizan correctamente, las sucesiones de perfiladores varían
segú n distintos campos no se derivan de un 114 Sp- 41111lellialinbarne oednarez ::
1 '119141111abirae la normal avinimal Dx1 en su diseñ o.

A mediados de la década de 1960 se descubrió el papel fundamental de las


relaciones funcionales para establecer un predador en entidades del mundo real.
Desde entonces, se ha venido aplicando el predicado de normalizació n a entidades,
con visió n del laramiento ló gico, porque el valor de todas las propiedades
invaluables disminuirá las pérdidas derivadas directas. El objetivo es combinar los
atributos de manera que cada entidad sea o represente, formados con las
propiedades invaluables, las permanencias en el tiempo, las reales en el mundo real,
el control auditivo de lib suspense comité hable.

4.2. Diagramas ER (Entidad-Relación)


Son cosas u objetos que son distinguibles de las demá s o artefactos del sistema en el
que estamos interesados en almacenar informació n. Por ejemplo, en una base que
almacena informació n sobre la distribució n organizacional de una empresa, una
entidad puede ser un empleado; de un hosped con informació n sobre su numeració n
de mó vil, domicilio y nombre, una entidad puede ser el mó vil. Está n asociadas a
atributos que describen sus propiedades. Atributos. Describen algunas de las
propiedades de la entidad correspondiente. Por ejemplo, si el ente es una persona,
los atributos pueden ser nombre, apellidos, fecha de nacimiento, etc. Si es un coche,
una de sus atributos es matrícula, modelo, color, etc. Los atributos tienen dominios.
El conjunto de posibles valores que puede tomar un atributo concreto se conoce
como dominio; Relaciones. Las relaciones definen una asociació n entre dos o má s
entidades. Es necesario determinar el nú mero de entidades que intervienen en la
relació n, su grado. Por ejemplo, una relació n puede existir entre dos entidades
(binaria) o entre una entidad y ella misma (unaria). El diagrama de entidades y
relaciones nos va a permitir ofrecer una visió n global de los objetos y relaciones que
se almacenan en una base de datos.

Diagrama que muestra un conjunto de entidades, las relaciones, los atributos y la


informació n de restricció n acerca de los esquemas conceptuales. Se conocen como
esquemas conceptuales a aquellas descripciones de la informació n almacenada en
una base de datos que son independientes de la base de datos real. De un esquema
conceptual se puede extraer un esquema ló gico o físico. En la prá ctica, el esquema
conceptual usualmente tiene una representació n grá fica, ver diagrama entidad-
relació n. Los tres conceptos bá sicos en un esquema E-R son: Entidades.

5. Sistemas de Gestión de Bases de Datos (SGBD)


Respecto a las estructuras de datos, las respectivas filiaciones (á reas de
conocimiento a las que pertenecen) que conforman la ontología asocian, de manera
similar a FOAF Request (PROVO) citado previamente, se puede hablar cercano al
tema de esta tesis. Ademá s, Web request on Validation Drop (VIVO), The
Bibliographic Ontology (BIBO), LA ontología de Sci-Cruch y The Data Catalog
Vocabulary (DCAT) no son ontologías asociadas con Computational Biology, sino
que poseen conexiones con la misma a través de Ontology For Biomedical
Investigations (OBI), Bio2-RD y The Dublin Core Metadata Initiative (DCMI).

A pesar de que características específicas de ambas investigaciones no presentan


apenas, como Linked Data Platform (LDP), no posee esta falta en las bases de datos
en las que se está n tratando con ellas. A continuació n, se comparan The Event
Ontology (EVENTO) con MADS/RDF, al igual que EVENTO con ORCID.

Respecto a las estructuras de datos, las respectivas filiaciones (á reas de


conocimiento a las que pertenecen) que conforman la ontología asocian, de manera
similar a FOAF Request (PROVO) citado previamente, se puede hablar cercano al
tema de esta tesis. Ademá s, Web request on Validation Drop (VIVO) y The
Bibliographic Ontology (BIBO) también son ontologías asociadas con Computational
Biology, añ adidas a VIVO y BIBO.
Los Dissertation-oriented Database Management Systems (DDBMS) son sistemas de
gestió n de bases de datos que proveen servicios de almacenamiento, consulta e
indexació n orientados hacia disertaciones (en inglés dissertation), que segú n la
definició n de la Real Academia de la Lengua Españ ola (RAE), es un tipo de
conferencia.

5.1. Tipos de SGBD


Segú n el modelo, los SGBD modelo, también denominados simples, son los má s
sencillos y suelen proporcionar facilidades de acceso a un ú nico usuario o a un
nú mero muy limitado de ellos. Mediante estas herramientas se genera unificar o
convivir con los ficheros que forman parte de la aplicació n. Segú n su
implementació n, los SGBD que se pueden clasificar segú n su implementació n se
caracterizan porque ofrecen diferentes formas de utilizació n de los recursos físicos
del sistema, como la memoria principal, espacio en disco, tiempo de acceso a los
datos, etc. Es una clasificació n muy cercana a la que se denominan Sistemas de
Gestió n de Ficheros Virtual. Los sistemas que manejan la base de datos y que
proporcionan los recursos necesarios del sistema partiendo de los ofrecidos por el
sistema operativo. La principal desventaja de esta implementació n es la falta de
disponibilidad, ya que todos los recursos será n utilizados por ella. Segú n su
ubicació n o forma de acceso de los usuarios. Es una clasificació n má s cercana al
acceso físico que tienen los usuarios a los datos, ya que a mayor distancia en su
clasificació n habrá menos acceso físico para los usuarios.

En la actualidad, existen una gran variedad de SGBD. A pesar de esa gran variedad,
la mayoría de estos se pueden clasificar a su vez en tipos, segú n su complejidad y
forma de manejar los datos o segú n su ubicació n respecto del usuario y la aplicació n
(nú mero de usuarios que puede tener el sistema de forma concurrente, su acceso a
los datos, etc.) como se puede ver en el esquema de la siguiente pá gina. Se
establecería por tanto una jerarquía en esta clasificació n de SGBD, teniendo en la
cú spide del á rbol el SGBD modelo.

5.2. Características y Funcionalidades


Dentro del SGBD se distinguen las siguientes funcionalidades comunes a todos los
SGBD: Creació n y definició n de la base de datos, Depurar errores y fallos del sistema,
Obtenció n de informació n. Dichas funciones pueden ser descompuestas en varias
funciones concretas (siempre y cuando se siga el modelo de tres esquemas): Definir
los datos ló gicos (indiv.) por lo que respecta a cada usuario específico de la BD,
Definir los datos físicos (indiv.) a nivel de cada programa específico que accede a un
fichero físico del sistema operativo, Definir las características de cada grupo de
usuarios para todo el sistema con respecto a los aspectos ló gicos, organizativos,
integridad, seguridad y concurrencia (es la definició n de las características de los
tres esquemas), Crear, actualizar y mantener toda la informació n interna necesaria
sobre la estructura y estado de la BD para poder hacer uso de ella, Detectar y
corregir posibles errores que se produzcan en el sistema tanto de funcionamiento
como de estructura, Proporcionar al usuario toda la informació n sobre los datos
objeto de su interés.

El propó sito de los sistemas de bases de datos no es solo minimizar los espacios,
sino también maximizar la eficiencia en el acceso a la informació n y facilitar sus
tareas de actualizació n y modificació n. Para que esto sea posible, un sistema de
bases de datos cuenta con un conjunto de características y funcionalidades, algunas
comunes casi a la totalidad de los sistemas (características de los SGBD). Las otras
características vienen condicionadas por la situació n 'física' de la BD y/o el SGBD en
el sistema informá tico. En un SGBD encontramos tres características generales
comunes a todos estos sistemas: Independencia física de los datos, Independencia
ló gica de los datos y Acceso monitorizado por parte del sistema a los datos.

6. Integridad y Seguridad de Datos


Seguridad de datos: La seguridad de los datos es un aspecto que los gestores de
bases de datos toman en cuenta, ya que desde la base de datos se pueden obtener
los datos de la organizació n y toda esta informació n es confidencial. Existen,
bá sicamente, dos formas de proteger los datos: protegiéndolos físicamente y
controlando el acceso a los mismos. La protecció n física del almacenamiento evita el
acceso al disco a cualquier persona no autorizada. Los discos quedan protegidos de
varias maneras: se colocan en recintos bajo llave, siendo controlado su acceso; en
los discos mantienen separados los datos eliminados de los nuevos entrelazá ndolos;
el borrado de datos se realiza de manera que puedan ser indecodificables, el
mantenimiento del espacio libre se realiza para que no haya una relació n entre sus
contenidos y la informació n que habrá en el futuro ni con lo que ha habido en el
pasado.

Integridad de datos: Las principales bases de datos permiten implementar medidas


para asegurar la integridad de los datos, es decir, impedir que sean accedidos
erró neamente. El principal mecanismo utilizado para asegurar la integridad de los
datos consiste en la definició n de claves primarias. En la terminología de E/R, en
una relació n R los atributos de un subconjunto K de sus atributos A son una clave, si
todo par de tuplas de R tiene valores diferentes para al menos un atributo de K. Si
má s de un subconjunto de atributos de R posee la propiedad anterior, se dice que R
posee má s de una clave. Restricciones adicionales que permiten asegurar la
integridad de los datos son las claves ajenas, restricciones de dominio, restricciones
de valores por defecto.

6.1. Restricciones de Integridad


Una Base de Datos relacional se compone de un conjunto de tablas, y cada tabla se
compone de un conjunto de filas y columnas, de forma aná loga a como lo hace una
hoja de cá lculo. Los sistemas que se encargan de gestionar BD relacionales utilizan
un lenguaje muy potente, denominado SQL (Structured Query Language - Lenguaje
de Consulta Estructurado), para realizar todo tipo de manipulació n de los datos. En
SQL se puede especificar de forma natural las relaciones entre campos de tablas
diferentes, con lo que se pueden establecer restricciones sobre los campos que no se
pueden violar, o mantener la integridad de los datos. Proporciona tipos
suficientemente generales como para que un analista pueda especificar estructuras
de datos arbitrarias. Ninguna restricció n de á lgebra relacional sintá ctica forzada
(por ejemplo, los atributos en la clá usula FROM deben ser renombrados si alguno de
ellos es el mismo nombre), por lo que las optimizaciones no está n limitadas por ello.

Una base de datos se puede definir como un conjunto de elementos de datos


almacenados en un soporte determinado, relacionados de tal manera que los
usuarios accedan a estos datos y los modifiquen segú n sus necesidades de forma
fá cil y eficiente. Una de las propiedades má s importantes de las BD es la integridad,
es decir, que mantienen la precisió n y consistencia de los datos. Existen dos tipos de
integridad de los datos, la integridad de entidad o de resto, que garantiza que en
todas las relaciones de la BD, las entidades que éstas definen no pueden duplicarse,
y la integridad de referencia, que garantiza que si una relació n A hace referencia a
otra relació n B, el valor de los atributos objeto de la referencia existen en la relació n
B.

6.2. Mecanismos de Seguridad


El está ndar JDBC permite la denegació n explícita de una transacció n. Si una
aplicació n necesita realizar procesamiento adicional después de una transacció n,
puede ejecutar una transacció n explícita sin necesidad de iniciar una conexió n con
auto-commit, después de una transacció n de commit ejecutó el resto del có digo de
negocio, cerró la conexió n. Para evitar una transacció n explícita y combinado con la
regla del bienestar SQL: operaciones exitosas (sean travezyalter) de zurdo a derecho
denunció tipadela operació n y finalizar el proceso de transacció n si ocurre un
problema. Para realizar la aprobació n decidido (o cualquier otro enfoque si lo
prefiere), la operació n se ejecuta denunció try-bloque. En el Java excepció n escriba
un catch-finally el bloque se ejecuta que cierra en cualquier caso la ejecució n realice
el recurso. Finalmente, la vez en un bloque finally se cierra el condicional.
Otro escenario de desprotecció n ocurre al emplear un procedimiento que realiza un
cambio en la base de datos tras haber comprobado todos los predicados necesarios,
por lo que no se esperan errores. Sin embargo, si tras la ejecució n del filtro el tipo de
dato varía (ya sea por una inserció n de datos situada en línea superior, o ademá s,
por nuevas tipificaciones de la clase de datos), se genera una inserció n indebida de
datos. Cuando dicha inserció n acarrea aprobables inconsistencias utilizando
alianzas y en uso continuo de atributos en una versió n anterior a los cambios.

La escalada de privilegios es otro problema típico de seguridad asociado a la


administració n y la gestió n de una base de datos. La escalada de privilegios ocurre
cuando un usuario de la base de datos con cierto conjunto de permisos necesita
efectuar operaciones que requieren de otro conjunto de permisos, de manera que
obtiene dichos permisos sin estar autorizado. Por ejemplo, si un usuario dispone del
permiso de lectura sobre los elementos de un catá logo pero, una vez accede a éstos,
encuentra un procedimiento almacenado que permite modificar ciertos valores, el
acceso sería indebido.

7. Recuperación y Copias de Seguridad


Es usado desde el método má s bá sico de la forma de nombre que requiere a un
usuario habría de cambiar el nombre de los programas y/o archivos editados así
cual otro sistema o archivo asociado tendría que ser modificado para que los
procedimientos de referencia correctos funciones correctamente. La mayoría de los
sistemas operativos modernos incluyen una combinació n de interfaces de línea de
comando y de interfaz grá fica de usuario que combinan el uso del rató n y teclado
para utilizar y explorar el equipo.

Copias de seguridad: es la posibilidad de prever un cierto tipo de fallo y de


recuperar los dañ os producidos por él, trayendo el estado de la base de datos al
momento en que fue efectuado un cierto tipo de copia. Un error de operador, un
fallo en el acceso de un dispositivo periférico, o un fallo de hardware pueden ser
resueltos mediante la restauració n de una compilació n de copia relacionada y,
algunos minutos antes del fallo, a través del procedimiento de recuperació n. Una
copia de seguridad o copia es una exactitud idéntica de un conjunto de datos.
Ademá s, se utiliza comú nmente en el sentido de copia de seguridad de los datos en
un dispositivo informá tico. Guardar es muy frecuentemente necesario cuando se
utiliza un dispositivo de almacenamiento de datos, tales como una unidad de cinta,
de disco o de otro formato de dispositivo, o la existencia de los datos corrompidos o
suprimidos.

Recuperació n: es la posibilidad de eliminar los dañ os producidos por un cierto tipo


de fallos en el sistema, y cuando los fallos suceden el estado de vida debe
mantenerse en consistencia. Los sistemas gestores de bases de datos incluyen
diversos mecanismos con el propó sito de permitir la recuperació n del sistema en
estado consistente, incluso después de un fallo. Los principales tipos de fallos
considerados normalmente son: pérdida del soporte físico (memoria volá til) donde
está almacenada informació n, fallos de los dispositivos periféricos o hardware, fallos
del sistema operativo, fallos de la aplicació n y fallos humanos.

8. Optimización de Consultas
Aunque el problema de optimizar un algoritmo de evaluació n de consultas es
intrínsecamente difícil porque hay muchos planes posibles a evaluar, los sistemas de
bases de datos deben enfrentarse con el problema. Por ello, se investigó có mo llevar
a cabo la fase de optimizació n automá tica, basá ndose en el planteamiento del
problema bajo un formalismo matemá tico que permitiera tratarlo adecuadamente.
Con esta idea surge una técnica en particular, que son los planes de ejecució n, en
donde las bú squedas utilizaron algoritmos eficientes de cá lculo y eligieron
estrategias de unió n y orden entre los archivos de entrada, operaciones de
procesamiento de conjunto, los datos se implementaron en estructuras optimizadas
y se minimizaron los costos generados al recuperar, copiar y desechar los registros.
Volviendo al planteamiento general, la ló gica de cada enunciado determina el modo
de ejecució n del comando algebraico que lo implementa. É ste puede ser mediante
alguna de las técnicas de acceso en clú ster, con datos distribuidos, seleccionando
solamente algunos de los campos de la relació n, probando sobre estos las
restricciones que tenían todo el conjunto y finalmente administrando el envío de
mensajes en la red. Dados los resultados parciales de cada enunciado, el siguiente
seleccionaba de ellos las columnas que requería y ademá s, si las relaciones
involucradas no habían sido ordenadas antes, administraba la concatenació n y
proyecció n segú n los distintos ó rdenes posibles. Generalmente, se computa el
resultado final, ordená ndolo de determinada manera, si es conveniente efectuar en
este momento, etapas derivadas; sino se emite un plan de ejecució n y se abandona el
sistema histó rico tras destruir los archivos temporarios.

El sistema de optimizació n de consultas es una parte crítica de un sistema de bases


de datos. Aú n así, algunos SGBDs toman caminos cortos en esta á rea, lo cual resulta
en un deterioro del funcionamiento del sistema. La inclusió n de funciones
adicionales, guardado de datos adicionales y bú squedas optimizadas son razones
suficientes para que los desarrolladores presten mucha atenció n a implementar un
sistema eficiente para optimizar las consultas. Pero la optimizació n de consultas en
bases de datos es un problema arduo, fundamentalmente porque un motor de
consultas debe simular un desarrollo teó rico complejo de có mo ejecutar una
consulta, y debe obtener esta simulació n mientras procesa una consulta que puede
tener muchas posibles estrategias de evaluació n.

9. Bases de Datos Distribuidas


Distribució n física de los datos: La base de datos distribuida no solo administra una
gran masa de datos, sino que lo hace ademá s geográ ficamente distribuida. Un
nú mero considerable de clientes que trabajan sobre posibles miles de bases de
datos deben tener la fantasmagó rica impresió n de que trabajan sobre una ú nica
masa de datos. Por eso, debe parecer que todo está concentrado, mientras en verdad
está diseminado en la red. La gestió n de los datos está muy relacionada con la
distribució n de los mismos. Para lograr la persistencia de los datos y garantizar su
control, es necesario que todos los datos estén almacenados en algú n lugar. Pero
ademá s, dichos datos deben estar físicamente distribuidos en toda la red,
respetando las reglas establecidas por el administrador de la base de datos
distribuida.

Principalmente, las bases de datos distribuidas deben comprender los siguientes


aspectos fundamentales: distribució n física de los datos, transparencia de la
distribució n, compartició n de los datos y procesamiento distribuido de las
consultas.

Una base de datos distribuida es una colecció n de mú ltiples bases de datos ló gicas
distribuidas en distintos nodos de una red de computadoras, cada una operando
sobre datos físicos propios a nivel local y que proporciona servicios de
transparencia de la distribució n (micro y macro) a sus aplicaciones.

10. Big Data y Bases de Datos NoSQL


Las primeras soluciones NoSQL nacen debido a la dificultad de almacenar e indexar
las grandes cantidades de datos generados por los motores de bú squeda (Google,
Yahoo) y má s ampliamente por sitios web. Estos recursos de Big Data necesitaban
ser almacenados de manera eficaz y flexible, así como ser indexables rá pidamente y
reutilizables. El término NoSQL se utiliza para designar a una base de datos que no
utiliza el mecanismo de almacenamiento en tabla mediante SQL. Ademá s, el
desarrollo NoSQL tiene las siguientes ventajas: escala fá cilmente, no requiere un
diseñ o preestablecido y es tolerante a fallos.

Pregunta 10.2. Bases de Datos NoSQL (Not Only SQL)

El término alternativo de Big Data se remonta a los problemas de manejar los


dataset de astronomía, genética, en geodésica, creació n de simulaciones, etc., donde
efectivamente se utilizaban modelos matemá ticos y estadísticos para evaluar el
contenido de los datos. En este contexto, ese término hace referencia a: Data mining,
Data science, Knowledge discovery in data, exploratory data analysis, machine
learning... Muchos gobiernos publican sus datos para que sean utilizados por
empresas o sistemas de inteligencia.

Pregunta 10.1. ¿Qué es el Big Data?

11. Tendencias y Futuro de las Bases de Datos


Una de las líneas de investigació n que se adivina má s interesantes de cara al futuro
del campo de bases de datos es la referente a las nuevas formas de obtener y
procesar informació n: técnicas para consultas inteligentes a bases de datos, soporte
para navegació n por el contenido informativo, sistemas de adquisició n de
informació n a gran escala, sistemas de bú squeda en las proximidades o en el
contexto del usuario, datos con semá ntica asociada, técnicas de almacenamiento y
consulta de grafos, sistemas para obtenció n y utilizació n de informació n en
dispositivos mó viles. El almacenamiento de informació n en la web, la
deslocalizació n y movilidad de los usuarios y el acceso y procesamiento
deslocalizado de grandes cantidades de informació n de muy distintas fuentes son
realidades a considerar. Posiblemente nos encontremos en un momento en el que ya
es prá cticamente imposible abarcar desde un ú nico punto de vista y en un ú nico
entorno la totalidad de la informació n a manejar. En consecuencia, los sistemas de
almacenamiento, acceso y manipulació n de informació n tendrá n que ser flexibles y
capaces de adaptarse a distintos escenarios, usuarios y dispositivos.

Durante los ú ltimos añ os han aparecido avances y nuevas tendencias en el campo de


bases de datos, muchas de ellas encaminadas hacia la flexibilidad y robustez de los
sistemas de gestió n de bases de datos a fin de permitir un soporte eficiente de
sistemas de informació n y aplicaciones emergentes. Los principales avances que
hacen que se vaticine un futuro prometedor aunque complejo del campo de bases de
datos son la deslocalizació n y movilidad, las nuevas formas de obtener y procesar
informació n, el almacenamiento de informació n en la web y la integració n de datos
provenientes de distintas fuentes.

También podría gustarte