Laboratorio Diccionario de Datos

¿QUE ES UN DICCIONARIO DE DATOS?
Un diccionario de datos es un conjunto de metadatos que contiene las características lógicas

y puntuales de los datos que se van a utilizar en el sistema que se programa, incluyendo
nombre, descripción, alias, contenido y organización.
Es un catálogo, un depósito, de los elementos en un sistema. Como su nombre lo sugiere,

estos elementos se centran alrededor de los datos y la forma en que están estructurados
para satisfacer los requerimientos de los usuarios y las necesidades de la organización.
En un diccionario de datos se encuentra la lista de todos los elementos que forman parte del
flujo de datos en todo el sistema. Los elementos más importantes son flujos de datos,
almacenes de datos y procesos. El diccionario guarda los detalles y descripciones de todos
estos elementos.
El diccionario se desarrolla durante el análisis de flujo de datos y auxilia a los analistas que
participan en la determinación de los requerimientos de sistemas.
Este diccionario Contiene las características lógicas de los sitios donde se almacenan los
datos del sistema, incluyendo nombre, descripción, alias, contenido y organización. Identifica
los procesos donde se emplean los datos y los sitios donde se necesita el acceso inmediato
a la información, se desarrolla durante el análisis de flujo de datos y auxilia a los analistas
que participan en la determinación de los requerimientos del sistema, su contenido también
se emplea durante el diseño.
Razones para la utilización de un diccionario de datos:
1. Para manejar los detalles en sistemas muy grandes, ya que tienen enormes
cantidades de datos, aun en los sistemas mas chicos hay gran cantidad de datos.
Los sistemas al sufrir cambios continuos, es muy difícil manejar todos los detalles. Por
eso se registra la información, ya sea sobre hoja de papel o usando procesadores de
texto. Los analistas mas organizados usan el diccionario de datos automatizados
diseñados específicamente para el análisis y diseño de software.
2. Para asignarle un solo significado a cada uno de los elementos y actividades del
sistema.
En un diccionario de datos se encuentra la lista de todos los elementos que forman parte del
flujo de datos de todo el sistema. Los elementos más importantes son flujos de datos,
almacenes de datos y procesos. El diccionario de datos guarda los detalles y descripción de
todos estos elementos.
Los diccionarios de datos proporcionan asistencia para asegurar significados comunes para
los elementos y actividades del sistema y registrando detalles adicionales relacionadas con el
flujo de datos en el sistema, de tal manera que todo pueda localizarse con rapidez.
Contenido de un registro del diccionario

El diccionario tiene dos tipos de descripciones para el flujo de datos del sistema, son los
elementos datos y estructura de datos.
Elemento dato: son los bloques básicos para todos los demás datos del sistema, por si
mismos no le dan un significado suficiente al usuario. Se agrupan para formar una estructura
de datos.
-Descripción: Cada entrada en el diccionario consiste de un conjunto de detalles que
describen los datos utilizados o producidos por el sistema.
-Cada uno esta identificado con:
-Un nombre: para distinguir un dato de otro.
-Descripción: indica lo que representa en el sistema.
-Alias: porque un dato puede recibir varios nombres, dependiendo de quien uso este dato.
-Longitud: porque es de importancia de saber la cantidad de espacio necesario para cada
dato.
-Valores de los datos: porque en algunos procesos solo son permitidos valores muy
específicos para los datos. Si los valores de los datos están restringidos a un intervalo
especifico, esto debe estar en la entrada del diccionario.
Estructura de datos: es un grupo de datos que están relacionados con otros y que en
conjunto describen un componente del sistema.
-Descripción:
Se construyen sobre cuatro relaciones de componentes. Se pueden utilizar las siguientes
combinaciones ya sea individualmente o en conjunción con alguna otra.
Relación secuencial: define los componentes que siempre se incluyen en una estructura de
datos.
-Relación de selección: (uno u otro), define las alternativas para datos o estructuras de
datos.
El diccionario de datos es un listado organizado de todos los datos que pertenecen a un

sistema. El objetivo de un diccionario de datos es dar precisión sobre los datos que se
manejan en un sistema, evitando así malas interpretaciones o ambigüedades. Define con
precisión los datos de entrada, salida, componentes de almacenes, flujos, detalles de las
relaciones entre almacenes, etc. Los diccionarios de datos son buenos complementos a los
diagramas de flujo de datos, los diagramas entidad-relación, etc.
Las características que se describen en el diccionario de datos son:
Name: Es el nombre del elemento de datos; debe ser significativo.
Alias: Cualquier otro nombre que se pueda usar para referirse al elemento de datos. Por
ejemplo, el nombre de un elemento de datos puede ser Balance actual, y el alias puede ser
Deuda: Solo se incluye el alias si realmente es necesario utilizarlo.
Type o tipo: Se refiere a si el elemento de datos contiene valor numérico, caracteres o

alfabético.
Size o tamaño: Se refiere al máximo de caracteres o de dígitos que puede tener el elemento
de datos.
Output formato reditmask: Indica cómo se presenta el dato al mostrarse en pantalla o al
imprimirse en un reporte. Por ejemplo, el número de teléfono del cliente se puede guardar en
el disco usando solo números 7878889999, pero presentarse editado en la pantalla o en el
reporte (787) 888-9999.
Default value: Es el valor que el elemento de datos tiene si no se cambia entrando otro
valor.
Prompt, column header or field caption: Es el nombre que se presenta en la pantalla o el

título del dato en el reporte.
Source: De dónde se origina el valor del elemento de datos. Puede ser una forma, un
departamento, otro sistema, etc.
Security: Identifica los individuos o departamentos que pueden modificar el elemento de

datos. Por ejemplo, la línea de crédito puede ser cambiada por el gerente de crédito.
Responsibleuser(s): Identifica el (los) usuarios responsables de entrar o cambiar los valores

del elemento de datos.
Acceptable Data and Data validation: Se especifica el dominio o valores permitidos.

Pueden ser valores específicos, una lista de valores, los valores que se encuentren en otro
archivo, etc. El valor puede tener reglas de validación; por ejemplo, el salario debe estar
entre lo permitido para la posición que el empleado ocupa.
Derivation formula: Si el valor es el resultado de un cálculo, se muestra la fórmula que se

utiliza.
Description orcom ments: Para proveer información adicional, notas o descripciones.
En informática, base de datos acerca de la terminología que se utilizará en un sistema de

información. Para comprender mejor el significado de un diccionario de datos, puede
considerarse su contenido como “datos acerca de los datos”; es decir, descripciones de
todos los demás objetos (archivos, programas, informes, sinónimos…) existentes en el
sistema.
Un diccionario de datos almacena la totalidad de los diversos esquemas y especificaciones

de archivos, así como sus ubicaciones. Si es completo incluye también información acerca
de qué programas utilizan qué datos, y qué usuarios están interesados en unos u otros
informes. Por lo general, el diccionario de datos está integrado en el sistema de información
que describe.
¿EN QUÉ CONSISTE LA NORMALIZACIÓN EN UNA BASE DE DATOS?
El proceso de normalización de bases de datos consiste en designar y aplicar una serie de

reglas a las relaciones obtenidas tras el paso del modelo entidad-relación al modelo
relacional.
Las bases de datos relacionales se normalizan para:
➢ Evitar la redundancia de los datos.

➢ Disminuir problemas de actualización de los datos en las tablas.
➢ Proteger la integridad de los datos.
En el modelo relacional es frecuente llamar tabla a una relación, aunque para que una tabla
sea considerada como una relación tiene que cumplir con algunas restricciones:
✓ Cada tabla debe tener su nombre único.

✓ No puede haber dos filas iguales. No se permiten los duplicados.
✓ Todos los datos en una columna deben ser del mismo tipo.
Reglas de Codd
Codd se percató de que existían bases de datos en el mercado las cuales decían ser
relacionales, pero lo único que hacían era guardar la información en las tablas, sin estar
estas tablas literalmente normalizadas; entonces éste publicó 12 reglas que un verdadero
sistema relacional debería tener, en la práctica algunas de ellas son difíciles de realizar. Un
sistema podrá considerarse "más relacional" cuanto más siga estas reglas.
Regla No. 1 - La Regla de la información
Toda la información en un RDBMS está explícitamente representada de una sola manera por
valores en una tabla.
Cualquier cosa que no exista en una tabla no existe del todo. Toda la información, incluyendo
nombres de tablas, nombres de vistas, nombres de columnas, y los datos de las columnas
deben estar almacenados en tablas dentro de las bases de datos. Las tablas que contienen
tal información constituyen el Diccionario de Datos. Esto significa que todo tiene que estar
almacenado en las tablas.
Toda la información en una base de datos relacional se representa explícitamente en el nivel
lógico exactamente de una manera: con valores en tablas. Por tanto los metadatos
(diccionario, catálogo) se representan exactamente igual que los datos de usuario. Y puede
usarse el mismo lenguaje (ej. SQL) para acceder a los datos y a los metadatos (regla 4).
Regla No. 2 - La regla del acceso garantizado
Cada ítem de datos debe ser lógicamente accesible al ejecutar una búsqueda que combine
el nombre de la tabla, su clave primaria, y el nombre de la columna.
Esto significa que dado un nombre de tabla, dado el valor de la clave primaria, y dado el
nombre de la columna requerida, deberá encontrarse uno y solamente un valor. Por esta
razón la definición de claves primarias para todas las tablas es prácticamente obligatoria.
Regla No. 3 - Tratamiento sistemático de los valores nulos
La información inaplicable o faltante puede ser representada a través de valores nulos

Un RDBMS (Sistema Gestor de Bases de Datos Relacionales) debe ser capaz de soportar el
uso de valores nulos en el lugar de columnas cuyos valores sean desconocidos.
➢ Se reconoce la necesidad de la existencia del valor nulo, el cual podría servir para
representar, o bien, una información desconocida (ejemplo, no se sabe la dirección de
un empleado), o bien una información que no aplica(a un empleado soltero no se le
puede asignar un nombre de esposa). Así mismo, consideremos el caso de un alumno
que obtiene 0 puntos en una prueba y el de un alumno que no presentó la prueba.
➢ Hay problemas para soportar los valores nulos en las operaciones relacionales,
especialmente en las operaciones lógicas, para lo cual se considera una lógica
trivaluada, con tres (no dos) valores de verdad: Verdadero, Falso y null. Se crean
tablas de verdad para las operaciones lógicas:
null AND null = null

Verdadero AND null = null
Falso AND null = Falso
Verdadero OR null = Verdadero, etc.
Regla No. 4 - La regla de la descripción de la base de datos
La descripción de la base de datos es almacenada de la misma manera que los datos

ordinarios, esto es, en tablas y columnas, y debe ser accesible a los usuarios autorizados.
La información de tablas, vistas, permisos de acceso de usuarios autorizados, etc. debe ser
almacenada exactamente de la misma manera: En tablas. Estas tablas deben ser accesibles
igual que todas las tablas, a través de sentencias de SQL (o similar).
Regla No. 5 - La regla del sub-lenguaje Integral
Debe haber al menos un lenguaje que sea integral para soportar la definición de datos,
manipulación de datos, definición de vistas, restricciones de integridad, y control de
autorizaciones y transacciones.
Esto significa que debe haber por lo menos un lenguaje con una sintaxis bien definida que
pueda ser usado para administrar completamente la base de datos.
Regla No. 6 - La regla de la actualización de vistas
Todas las vistas que son teóricamente actualizables, deben ser actualizables por el sistema
mismo.
La mayoría de las RDBMS permiten actualizar vistas simples, pero deshabilitan los intentos
de actualizar vistas complejas.
Regla No. 7 - La regla de insertar y actualizar
La capacidad de manejar una base de datos con operandos simples aplica no sólo para la
recuperación o consulta de datos, sino también para la inserción, actualización y borrado de
datos.
Esto significa que las cláusulas para leer, escribir, eliminar y agregar registros (SELECT,
UPDATE, DELETE e INSERT en SQL) deben estar disponibles y operables,
independientemente del tipo de relaciones y restricciones que haya entre las tablas o no.
Regla No. 8 - La regla de independencia física
El acceso de usuarios a la base de datos a través de terminales o programas de aplicación,

debe permanecer consistente lógicamente cuando quiera que haya cambios en los datos
almacenados, o sean cambiados los métodos de acceso a los datos.
El comportamiento de los programas de aplicación y de la actividad de usuarios vía

terminales debería ser predecible basados en la definición lógica de la base de datos, y éste
comportamiento debería permanecer inalterado, independientemente de los cambios en la
definición física de ésta.
Regla No. 9 - La regla de independencia lógica
Los programas de aplicación y las actividades de acceso por terminal deben permanecer
lógicamente inalterados cuando quiera que se hagan cambios (según los permisos
asignados) en las tablas de la base de datos.
La independencia lógica de los datos especifica que los programas de aplicación y las
actividades de terminal deben ser independientes de la estructura lógica, por lo tanto los
cambios en la estructura lógica no deben alterar o modificar estos programas de aplicación.
Regla No. 10 - La regla de la independencia de la integridad
Todas las restricciones de integridad deben ser definibles en los datos, y almacenables en el
catálogo, no en el programa de aplicación.
Las reglas de integridad: Ningún componente de una clave primaria puede tener valores en
blanco o nulos (ésta es la norma básica de integridad).
Para cada valor de clave foránea deberá existir un valor de clave primaria concordante. La
combinación de estas reglas asegura que haya integridad referencial.
Regla No. 11 - La regla de la distribución
El sistema debe poseer un lenguaje de datos que pueda soportar que la base de datos esté
distribuida físicamente en distintos lugares sin que esto afecte o altere a los programas de
aplicación.
El soporte para bases de datos distribuidas significa que una colección arbitraria de
relaciones, bases de datos corriendo en una mezcla de distintas máquinas y distintos
sistemas operativos y que esté conectada por una variedad de redes, pueda funcionar como
si estuviera disponible como en una única base de datos en una sola máquina.
Regla No. 12 - Regla de la no-subversión
Si el sistema tiene lenguajes de bajo nivel, estos lenguajes de ninguna manera pueden ser
usados para violar la integridad de las reglas y restricciones expresadas en un lenguaje de
alto nivel (como SQL).
Algunos productos solamente construyen una interfaz relacional para sus bases de datos No
relacionales, lo que hace posible la subversión (violación) de las restricciones de integridad.
Esto no debe ser permitido.
La normalización es el proceso mediante el cual se transforman datos complejos a un

conjunto de estructuras de datos más pequeñas, que además de ser más simples y más
estables, son más fáciles de mantener. También se puede entender la normalización como
una serie de reglas que sirven para ayudar a los diseñadores de bases de datos a desarrollar
un esquema que minimice los problemas de lógica.
Cada regla está basada en la que le antecede. La normalización se adoptó porque el viejo
estilo de poner todos los datos en un solo lugar, como un archivo o una tabla de la base de
datos, era ineficiente y conducía a errores de lógica cuando se trataban de manipular los
datos.
Otra ventaja de la normalización de base de datos es el consumo de espacio. Una base de

datos normalizada ocupa menos espacio en disco que una no normalizada. Hay menos
repetición de datos, lo que tiene como consecuencia un mucho menor uso de espacio en
disco.
Existen básicamente tres niveles de normalización: Primera Forma Normal (1NF), Segunda
Forma Normal (2NF) y Tercera Forma Normal (3NF). Cada una de estas formas tiene sus
propias reglas.
REGLA DESCRIPCION Primera Forma Normal (1FN) Incluye la eliminación de todos los
grupos repetidos. Segunda Forma Normal (2FN) Asegura que todas las columnas que no son
llave sean completamente dependientes de la llave primaria (PK). Tercera Forma Normal
(3FN) Elimina cualquier dependencia transitiva. Una dependencia transitiva es aquella en la
cual las columnas que no son llave son dependientes de otras columnas que tampoco son
llave.
PRIMERA FORMA NORMAL 1FN
La regla de la Primera Forma Normal establece que las columnas repetidas deben eliminarse
y colocarse en tablas separadas. Poner la base de datos en la Primera Forma Normal
resuelve el problema de los encabezados de columna múltiples. Muy a menudo, los
diseñadores de bases de datos inexpertos harán algo similar a la tabla no normalizada. Una
y otra vez, crearán columnas que representen los mismos datos. La normalización ayuda a
clarificar la base de datos y a organizarla en partes más pequeñas y más fáciles de entender.
En lugar de tener que entender una tabla gigantesca y monolítica que Tiene muchos
diferentes aspectos, sólo tenemos que entender los objetos pequeños y más tangibles, así
como las relaciones que guardan con otros objetos también pequeños.
SEGUNDA FORMA NORMAL 2FN
La regla de la Segunda Forma Normal establece que todas las dependencias parciales se
deben eliminar y separar dentro de sus propias tablas. Una dependencia parcial es un
término que describe a aquellos datos que no dependen de la llave primaria de la tabla para
identificarlos. Una vez alcanzado el nivel de la Segunda Forma Normal, se controlan la
mayoría de los problemas de lógica. Podemos insertar un registro sin un exceso de datos en
la mayoría de las tablas.
TERCERA FORMA NORMAL 3FN
Una tabla está normalizada en esta forma si todas las columnas que no son llave son
funcionalmente dependientes por completo de la llave primaria y no hay dependencias
transitivas. Una dependencia transitiva es aquella en la cual existen columnas que no son
llave que dependen de otras columnas que tampoco son llave. Cuando las tablas están en la
Tercera Forma Normal se previenen errores de lógica cuando se insertan o borran registros.
Cada columna en una tabla está identificada de manera única por la llave primaria, y no debe
haber datos repetidos. Esto provee un esquema limpio y elegante, que es fácil de trabajar y
expandir.
En resumen La normalización es una técnica que se utiliza para crear relaciones lógicas
apropiadas entre tablas de una base de datos. Ayuda a prevenir errores lógicos en la
manipulación de datos. La normalización facilita también agregar nuevas columnas sin
romper el esquema actual ni las relaciones. Existen varios niveles de normalización: Primera
Forma Normal, Segunda Forma Normal, Tercera Forma Normal, Forma Normal Boyce-Codd,
Cuarta Forma Normal, Quinta Forma Normal o Forma Normal de Proyección-Unión, Forma
Normal de Proyección-Unión Fuerte, nuevo nivel o forma nos acerca más a hacer una base
de datos verdaderamente relacional. Se Forma Normal de Proyección-Unión Extra Fuerte y
Forma Normal de Clave de Dominio. Cada discutieron las primeras tres formas. Éstas
proveen suficiente nivel de normalización para cumplir con las necesidades de la mayoría de
las bases de datos. Normalizar demasiado puede conducir a tener una base de datos
ineficiente y hacer a su esquema demasiado complejo para trabajar. Un balance apropiado
de sentido común y práctico puede ayudarnos a decidir cuándo normalizar.
¿EN QUÉ CONSISTE EL LENGUAJE ESTRUCTURADO DE BASE DE DATOS?
El lenguaje de consulta estructurado o SQL (por sus siglas en inglés Structured Query
Language) es un lenguaje declarativo de acceso a bases de datos relacionales que permite
especificar diversos tipos de operaciones en ellas. Una de sus características es el manejo
del álgebra y el cálculo relacional que permiten efectuar consultas con el fin de recuperar de
forma sencilla información de interés de bases de datos, así como hacer cambios en ellas.
Los orígenes del SQL están ligados a los de las bases de datos relacionales. En 1970 E. F.
Codd propone el modelo relacional y asociado a este un sub-lenguaje de acceso a
los datos basado en el cálculo de predicados. Basándose en estas ideas, los laboratorios
de IBM definieron el lenguaje SEQUEL (Structured English Query Language) que más tarde
fue ampliamente implementado por el sistema de gestión de bases de datos (SGBD)
experimental System R, desarrollado en 1977 también por IBM. Sin embargo,
fue Oracle quien lo introdujo por primera vez en 1979 en un producto comercial.
El SEQUEL terminó siendo el predecesor de SQL, que es una versión evolucionada del
primero. El SQL pasa a ser el lenguaje por excelencia de los diversos sistemas de gestión de
bases de datos relacionales surgidos en los años siguientes y fue por fin estandarizado en
1986 por el ANSI, dando lugar a la primera versión estándar de este lenguaje, el "SQL-86" o
"SQL1". Al año siguiente este estándar es también adoptado por la ISO. Sin embargo, este
primer estándar no cubría todas las necesidades de los desarrolladores e incluía
funcionalidades de definición de almacenamiento que se consideró suprimirlas. Así que,
en 1992, se lanzó un nuevo estándar ampliado y revisado del SQL llamado "SQL-92" o
"SQL2".
En la actualidad el SQL es el estándar de facto de la inmensa mayoría de los SGBD

comerciales. Y, aunque la diversidad de añadidos particulares que incluyen las distintas
implementaciones comerciales del lenguaje es amplia, el soporte al estándar SQL-92 es
general y muy amplio.
El ANSI SQL sufrió varias revisiones y agregados a lo largo del tiempo:

Año Nombre Alias Comentarios
1986 SQL-86 SQL-87 Primera publicación hecha por ANSI. Confirmada
por ISO en 1987.
1989 SQL-89 Revisión menor.
1992 SQL-92 SQL2 Revisión mayor.
1999 SQL:1999 SQL2000 Se agregaron expresiones regulares, consultas recursivas (para
relaciones jerárquicas), triggers y algunas características
orientadas a objetos.
2003 SQL:2003 Introduce algunas características de XML, cambios en las
funciones, estandarización del objeto sequence y de las columnas
autonumericas. (Ver Eisenberg et al.: SQL: 2003 Has Been
Published.)
2005 SQL:2005 ISO/IEC 9075-14:2005 Define las maneras en las cuales el SQL
se puede utilizar conjuntamente con XML. Define maneras de
importar y guardar datos XML en una base de datos SQL,
manipulándolos dentro de la base de datos y publicando el XML y
los datos SQL convencionales en forma XML. Además,
proporciona facilidades que permiten a las aplicaciones integrar
dentro de su código SQL el uso de XQuery, lenguaje de consulta
XML publicado por el W3C (World Wide Web Consortium) para
acceso concurrente a datos ordinarios SQL y documentos XML.
2008 SQL:2008 Permite el uso de la cláusula ORDER BY fuera de las definiciones
de los cursores. Incluye los disparadores del tipo INSTEAD OF.
Añade la sentencia TRUNCATE.
Características generales del SQL
El SQL es un lenguaje de acceso a bases de datos que explota la flexibilidad y potencia de

los sistemas relacionales y permite así gran variedad de operaciones.
Es un lenguaje declarativo de "alto nivel" o "de no procedimiento" que, gracias a su fuerte

base teórica y su orientación al manejo de conjuntos de registros —y no a registros
individuales— permite una alta productividad en codificación y la orientación a objetos.
De esta forma, una sola sentencia puede equivaler a uno o más programas que se utilizarían
en un lenguaje de bajo nivel orientado a registros.
SQL también tiene las siguientes características:
Lenguaje de definición de datos: El LDD de SQL proporciona comandos para la definición

de esquemas de relación, borrado de relaciones y modificaciones de los esquemas de
relación.
Lenguaje interactivo de manipulación de datos: El LMD de SQL incluye lenguajes de
consultas basado tanto en álgebra relacional como en cálculo relacional de tuplas.
Integridad: El LDD de SQL incluye comandos para especificar las restricciones de integridad
que deben cumplir los datos almacenados en la base de datos.
Definición de vistas: El LDD incluye comandos para definir las vistas.
Control de transacciones: SQL tiene comandos para especificar el comienzo y el final de una
transacción.
SQL incorporado y dinámico: Esto quiere decir que se pueden incorporar instrucciones de
SQL en lenguajes de programación como: C++, C, Java, PHP, Cobol, Pascal y Fortran.
Autorización: El LDD incluye comandos para especificar los derechos de acceso a las
relaciones y a las vistas.
Tipos de Datos
Algunos de los tipos de datos básicos de SQL son:
Date: una fecha de calendario que contiene el año (de cuatro cifras), el mes y el día.
Time: La hora del día en horas minutos segundos (el valor predeterminado es 0).
Timestamp: la combinación de Date y Time.
Optimización
Como ya se dijo antes, y suele ser común en los lenguajes de acceso a bases de datos de
alto nivel, el SQL es un lenguaje declarativo. O sea, que especifica qué es lo que se quiere y
no cómo conseguirlo, por lo que una sentencia no establece explícitamente un orden de
ejecución.
El orden de ejecución interno de una sentencia puede afectar seriamente a la eficiencia del
SGBD, por lo que se hace necesario que éste lleve a cabo una optimización antes de su
ejecución. Muchas veces, el uso de índices acelera una instrucción de consulta, pero
ralentiza la actualización de los datos. Dependiendo del uso de la aplicación, se priorizará el
acceso indexado o una rápida actualización de la información. La optimización difiere
sensiblemente en cada motor de base de datos y depende de muchos factores.
Existe una ampliación de SQL conocida como FSQL (Fuzzy SQL, SQL difuso) que permite el
acceso a bases de datos difusas, usando la lógica difusa. Este lenguaje ha sido
implementado a nivel experimental y está evolucionando rápidamente.
El SQL
El lenguaje estructurado de consultas, más comúnmente llamado SQL, lo conforman una

serie de comandos, cláusulas y funciones que permiten realizar cualquier operación sobre la
información almacenada en la base de datos.
SQL no es exactamente un lenguaje de programación pero lleva implícita la complejidad de

estas herramientas. En realidad, los sistemas gestores de bases de datos como Microsoft
Access o el mismo OpenOffice Base tienen como principal fin ocultar el lado oscuro de este
lenguaje mediante el uso de utilidades gráficas. Aunque si tu intención es llegar a dominar el
mundo de las bases de datos es imprescindible conocer ciertos aspectos de SQL.
Las aplicaciones en red son cada día más numerosas y versátiles. En muchos casos, el
esquema básico de operación es una serie de scripts que rigen el comportamiento de una
base de datos.
Debido a la diversidad de lenguajes y de bases de datos existentes, la manera de comunicar
entre unos y otras sería realmente complicada a gestionar de no ser por la existencia de
estándares que nos permiten el realizar las operaciones básicas de una forma universal.
Es de eso de lo que trata el Structured Query Language que no es más que un lenguaje
estándar de comunicación con bases de datos. Hablamos por tanto de un lenguaje
normalizado que nos permite trabajar con cualquier tipo de lenguaje (ASP o PHP) en
combinación con cualquier tipo de base de datos (MS Access, SQL Server, MySQL…).
El hecho de que sea estándar no quiere decir que sea idéntico para cada base de datos. En
efecto, determinadas bases de datos implementan funciones específicas que no tienen
necesariamente que funcionar en otras.
El lenguaje de consulta estructurado (SQL) es un lenguaje de base de datos normalizado,

utilizado por el motor de base de datos de Microsoft Jet. SQL se utiliza para crear objetos
QueryDef, como el argumento de origen del método Open Record Set y como la propiedad
RecordSource del control de datos. También se puede utilizar con el método Execute para
crear y manipular directamente las bases de datos Jet y crear consultas SQL de paso a
través para manipular bases de datos remotas cliente – servidor.
Componentes del SQL El lenguaje SQL está compuesto por comandos, cláusulas,
operadores y funciones de agregado. Estos elementos se combinan en las instrucciones para
crear, actualizar y manipular las bases de datos.
COMANDOS
Existen dos tipos de comandos SQL:
• Los DLL que permiten crear y definir nuevas bases de datos, campos e índices.
• Los DML que permiten generar consultas para ordenar, filtrar y extraer datos de la base de
datos.
Comandos DLL Comando Descripción CREATE Utilizado para crear nuevas tablas, campos
e índices:
DROP Empleado para eliminar tablas e índices
ALTER Utilizado para modificar las tablas agregando campos o cambiando la definición de
los campos.
Comandos DML Comando Descripción
SELECT Utilizado para consultar registros de la base de datos que satisfagan un criterio
determinado
INSERT Utilizado para cargar lotes de datos en la base de datos en una única operación.
UPDATE Utilizado para modificar los valores de los campos y registros especificados
DELETE Utilizado para eliminar registros de una tabla de una base de datos
CLÁUSULAS
Las cláusulas son condiciones de modificación utilizadas para definir los datos que desea
seleccionar o manipular.
Comando Descripción
FROM Utilizada para especificar la tabla de la cual se van a seleccionar los registros
WHERE Utilizada para especificar las condiciones que deben reunir los registros que se van
a seleccionar
GROUP Utilizada para separar los registros seleccionados en grupos específicos

HAVING Utilizada para expresar la condición que debe satisfacer cada grupo
ORDER BY Utilizada para ordenar los registros seleccionados de acuerdo con un orden
específico
OPERADORES LÓGICOS
Operador: Uso
AND Es el “y” lógico. Evalúa dos condiciones y devuelve un

valor de verdad sólo si ambas son ciertas.
OR Es el “o” lógico. Evalúa dos condiciones y devuelve un valor de verdad si alguna de las
dos es cierta.
NOT Negación lógica. Devuelve el valor contrario de la expresión.
Operadores de Comparación
Operador Uso:
Mayor que distinto de = Mayor ó Igual que BETWEEN Utilizado para especificar un intervalo
de valores.
LIKE: Utilizado en la comparación de un modelo
In: Utilizado para especificar registros de una base de datos
Funciones de Agregado
Las funciones de agregado se usan dentro de una cláusula SELECT en grupos de registros
para devolver un único valor que se aplica a un grupo de registros.
Comando Descripción
AVG: Utilizada para calcular el promedio de los valores de un campo determinado
COUNT: Utilizada para devolver el número de registros de la selección
SUM: Utilizada para devolver la suma de todos los valores de un campo determinado
MAX: Utilizada para devolver el valor más alto de un campo especificado
MIN: Utilizada para devolver el valor más bajo de un campo especificado

Laboratorio Diccionario de Datos

Cargado por

Copyright:

Formatos disponibles

Laboratorio Diccionario de Datos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Laboratorio Diccionario de Datos

Cargado por

Copyright:

Formatos disponibles

¿QUE ES UN DICCIONARIO DE DATOS?

Un diccionario de datos es un conjunto de metadatos que contiene las características lógicas

Es un catálogo, un depósito, de los elementos en un sistema. Como su nombre lo sugiere,

Razones para la utilización de un diccionario de datos:

Contenido de un registro del diccionario

El diccionario de datos es un listado organizado de todos los datos que pertenecen a un

Las características que se describen en el diccionario de datos son:

Name: Es el nombre del elemento de datos; debe ser significativo.

Deuda: Solo se incluye el alias si realmente es necesario utilizarlo.

Type o tipo: Se refiere a si el elemento de datos contiene valor numérico, caracteres o

Prompt, column header or field caption: Es el nombre que se presenta en la pantalla o el

Security: Identifica los individuos o departamentos que pueden modificar el elemento de

Responsibleuser(s): Identifica el (los) usuarios responsables de entrar o cambiar los valores

Acceptable Data and Data validation: Se especifica el dominio o valores permitidos.

Derivation formula: Si el valor es el resultado de un cálculo, se muestra la fórmula que se

Description orcom ments: Para proveer información adicional, notas o descripciones.

En informática, base de datos acerca de la terminología que se utilizará en un sistema de

Un diccionario de datos almacena la totalidad de los diversos esquemas y especificaciones

El proceso de normalización de bases de datos consiste en designar y aplicar una serie de

Las bases de datos relacionales se normalizan para:

➢ Evitar la redundancia de los datos.

✓ Cada tabla debe tener su nombre único.

Regla No. 1 - La Regla de la información

Regla No. 2 - La regla del acceso garantizado

Regla No. 3 - Tratamiento sistemático de los valores nulos

La información inaplicable o faltante puede ser representada a través de valores nulos

null AND null = null

Regla No. 4 - La regla de la descripción de la base de datos

La descripción de la base de datos es almacenada de la misma manera que los datos

Regla No. 5 - La regla del sub-lenguaje Integral

Regla No. 6 - La regla de la actualización de vistas

Regla No. 7 - La regla de insertar y actualizar

Regla No. 8 - La regla de independencia física

El acceso de usuarios a la base de datos a través de terminales o programas de aplicación,

El comportamiento de los programas de aplicación y de la actividad de usuarios vía

Regla No. 9 - La regla de independencia lógica

Regla No. 10 - La regla de la independencia de la integridad

Regla No. 11 - La regla de la distribución

La normalización es el proceso mediante el cual se transforman datos complejos a un

Otra ventaja de la normalización de base de datos es el consumo de espacio. Una base de

SEGUNDA FORMA NORMAL 2FN

TERCERA FORMA NORMAL 3FN

En la actualidad el SQL es el estándar de facto de la inmensa mayoría de los SGBD

El ANSI SQL sufrió varias revisiones y agregados a lo largo del tiempo:

Características generales del SQL

El SQL es un lenguaje de acceso a bases de datos que explota la flexibilidad y potencia de

Es un lenguaje declarativo de "alto nivel" o "de no procedimiento" que, gracias a su fuerte

SQL también tiene las siguientes características:

Lenguaje de definición de datos: El LDD de SQL proporciona comandos para la definición

El lenguaje estructurado de consultas, más comúnmente llamado SQL, lo conforman una

SQL no es exactamente un lenguaje de programación pero lleva implícita la complejidad de

El lenguaje de consulta estructurado (SQL) es un lenguaje de base de datos normalizado,

Existen dos tipos de comandos SQL:

DROP Empleado para eliminar tablas e índices

Comandos DML Comando Descripción

GROUP Utilizada para separar los registros seleccionados en grupos específicos

AND Es el “y” lógico. Evalúa dos condiciones y devuelve un

NOT Negación lógica. Devuelve el valor contrario de la expresión.

LIKE: Utilizado en la comparación de un modelo