Manual VSAM
Manual VSAM
Manual VSAM
1 de 36
CONTENIDO.
1. Archivos. 1.1. Informacin. 1.1.1. Informacin. 1.1.2. Aspectos de la informacin en la organizacin de archivos. 1.2. Estructura_de_los_registros 1.2.1. Longitud fija. Bloqueados, Des - bloqueados. 1.2.2. Longitud variable. Bloqueados, Des - bloqueados. 1.2.3. Tipos_de_registros. (Datos, Auxiliares (OVF, Rtulos, Verificacin, Control, cheek point) 1.3. Campos. 1.3.1. Tipos_de_datos o campos en un registro. 1.3.2. Caractersticas de los campos (longitud, clase, alineacin, relleno). 1.4. Procesos con Archivos. 1.4.1. Definiciones. 1.4.2. Por lotes, en lnea. 1.4.3. Caracterizacin_y categorizacin de los archivos. 1.4.4. Creacin_y_mantencin_de_archivos 1.4.4.1. Respaldos 1.4.5. Conceptos_sobre_archivos Volatilidad, actividad, tamao. 1.4.6. Tipos_de_archivos (Maestros, Referencias, transacciones, paso, informes). 1.4.7. Procesos_con_archivos Clasificacin, Intercalacin, actualizacin, etc. 1.5. Soportes de hardware para archivos. ORGANIZACIONES. 2.1. Archivos secuenciales. 2.1.1. Organizacin secuencial 2.1.2. Diferentes tipos de archivos secuenciales. 2.2. Archivos secuencial_indexado 2.3. Archivos VSAM. 2.4. Archivos de organizacin directa. 2.4.1. Organizacin directa. 2.4.2. relativa 2.4.3. Organizaciones de multi listas. 2.5. Otras organizaciones de archivos. 2.6. Bases de datos. EJERCICIOS
2.
3.
2 de 36
INTRODUCCIN.
Este apunte tiene el objetivo de servir de apoyo a los alumnos de la asignatura de Organizacin y manejo de archivo. Esta asignatura es, tal vez, la ms importante en esta carrera, ella da el perfil exacto que esperamos tengan nuestros alumnos cuando se desempeen como profesionales. Se trata de darles el conocimiento y la prctica sobre los archivos. Aqu, no es importante el lenguaje de programacin, este pasa a ser una herramienta. Lo importante es que el alumno aprenda a solucionar los problemas que diariamente se le presentarn en las organizaciones donde labore: Entregar el informe que no consideraba el SIA. Disear y programar la solucin para extirpar partes de un archivo para entregrselo a un cliente o un proveedor. Conocer como realizar filtros rpidos en archivos que no son bases de datos. Convertir archivos de un software a otro. Agregar un nuevo campo a un archivo. Etc. Adems, por cierto de las tareas habituales de plantear y desarrollar el diseo fsico de un SIA. Es importante hacer notar que el modelamiento de datos realizado en el diseo lgico no tiene una correspondencia uno a uno con los archivos que se tendrn en el diseo fsico. Es all donde nuestro alumno debe proveer las soluciones que hagan ms eficaz el SIA. Para entender a cabalidad el tema de archivos, comenzar con las definiciones bsicas: Campo: Registro: Archivo:
3 de 36
INFORMACION Definicin.-
Es todo el material "registrado" o comunicado que tiene cierta significacin asociada con una representacin simblica.
En este punto tal vez sea importante aclarar la diferencia entre informacin y datos. Informacin es cuando un conjunto de datos aporta al receptor un nuevo conocimiento, en cambio los datos es aquello que no aporta un nuevo conocimiento al receptor. Es muy frecuente escuchar que la informacin es el recurso ms preciado de la organizacin, esto no es solo un decir, es realmente as. Para los profesionales de la informtica este hecho tiene una gran significacin puesto que la captura, almacenamiento, mantencin, actualizacin y acceso de esta informacin esta encargada a los profesionales de la informtica, o sea, a ustedes. La informacin en la organizacin es la base de la toma de decisiones. Esta informacin aporta los datos y hechos que se transformarn en alternativas posibles y entregar los elementos de juicio necesarios para resolver el problema decisional estableciendo las mejores alternativas y elijiendo una.
DECISIN DECISIN ACCIN INFORMACIN INFORMACIN
ACCIN
DATOS
Fuentes de informacin. Cualquier elemento de datos puede participar en la generacin de partes mltiples de informacin. Es importante su flexibilidad para que puedan ser agregados y sumados de tal manera que pueda producirse informacin til para apoyar las decisiones oportunamente. Tambin algunos elementos de datos resultan de acciones tomadas por fuerzas o cuerpos externos a la organizacin, como, accin de competidores, requerimientos legales, etc. Los datos deben ser manejados de tal manera que sean correctos y estn disponibles para producir informacin; los aspectos que deben considerarse son: Medicin, Coleccin, Transcripcin, Validacin, Organizacin, Almacenamiento, Agregacin, Actualizacin, Recuperacin, Proteccin. La informacin no es el nico elemento en la toma de decisiones, tambin esta:
4 de 36
El objetivo (debe tenerse claro). Prediccin (para tener cierto grado de seguridad en la decisin). Evaluacin. Se debe disponer de procedimientos para calificar cada alternativa.
En cunto a la informacin: Esta debe proveer los antecedentes de: Situacin actual. Situacin a alcanzar. Recursos para resolver el problema (estadsticos, experiencia). El vehculo que permite el transporte de la informacin de un lado a otro es la comunicacin (==> Sistema de Informacin) La forma en que se lleva a cabo la informacin en una organizacin constituye un sistema de informacin. Objetivos del manejo de datos. Los datos deben representarse y almacenarse en cierta forma para accesarlos posteriormente. Los datos deben organizarse de manera adecuada para accesarlos selectiva y eficientemente. Los datos deben procesarse y presentarse de tal manera que puedan apoyar eficientemente al usuario. Los datos deben protegerse y manejarse para que no pierdan su valor. Porque es necesario organizar la informacin en archivos? Caracterstica de toda informacin til es que sea fcil de accesarla y recuperarla. Volumen alto y desordenada ==> bsqueda lenta y difcil. Todos los archivos existen solo en funcin de la informacin que contienen y de los usos que a esta se le d. Los usos de los archivos definirn el tipo de organizacin que los archivos debern tener. En un sistema computacional se usan muchos archivos y cada uno de ellos cumplen una funcin muy especfica. Para el anlisis de estos archivos, primero, hay que ocuparse de sus componentes bsicos, estos son: Registros. Que contienen toda la informacin concerniente a un individuo del archivo. Campos. Que son cada uno de los atributos de un individuo (registro).
5 de 36
Registro lgico:
Registro fsico:
Un registro es una coleccin finita y ordenada de elementos (campos), posiblemente heterogneos, que se tratan como una unidad. La creacin de un archivo en un dispositivo de almacenamiento magntico (cinta, disco, etc.) se realiza mediante una secuencia de operaciones de escritura (grabacin). Al conjunto de datos transferidos en cada operacin de escritura/lectura se le llama registro fsico.
Un registro, por lo general, contiene un campo (sub campo o conjunto de ellos) que lo identifica, a esto se le denomina CLAVE. Los registros son los elementos que contienen la informacin concerniente a un individuo del archivo. En la mayor parte de los lenguajes de programacin el acceso se produce a ellos (algunos producen el acceso al campo). Un registro fsico o bloque es la cantidad ms pequea de datos que pueden transferirse en una operacin de entrada / salida entre la memoria principal y los dispositivos perifricos o viceversa. Ejemplos de registros fsicos son una lnea de impresin, un sector de un disco magntico. Un bloque puede contener uno o mas registros lgicos.
Los registros se clasifican en: Registros de longitud fija. Registros de longitud variable Los registros de longitud variables pueden deberse a: Que existen campos de longitud variables en el registro. La existencia o ausencia de campos en el registro. Cualquiera sea la causa en un registro de longitud variable, siempre encontraremos dos secciones: Seccin fija.(datos identificadores e indicativos) Seccin opcional. FORMAS De secuencia fija
SECCIN FIJA A B C D E F
De secuencia opcional
SECCIN FIJA * B * * * indica que falta. E F
Si A, B, C,.. son de longitud variable ser necesario indicar el fin de cada uno separndolo del siguiente.
SECCIN FIJA A B C
6 de 36
SECCIN FIJA
EX.
N.EX
EX.
Secuencia variable es necesario que cada campo o grupo de campos tenga su propio identificador.
SECCIN FIJA Lg.A A Lg.B B Lg.C C
Si adems cada campo es de longitud variable se debe indicar su longitud o poner una marca de fin de campo.
CONTENIDO
7 de 36
TIPOS DE REGISTROS.
Existen dos tipos de registros; de datos y auxiliares. 1) Registros de datos. Son los registros que contienen la informacin, con datos (campos) actualizables. 2) Registros auxiliares. Son registros que sirven a propsitos especficos NO relacionados con el SIA, sino con el proceso propio de los archivos, o que ayudan al mejor proceso de estos. OVF o de cola. Estos corresponden a registros que no tienen cabida en el rea donde est la informacin de los archivos y por lo tanto, aunque contienen informacin propia del archivo, deben ubicarse en otro lugar. Ejemplo de estos registros son aquellos casos en que campos de aparicin espordica en el archivo no se ponen en el rea primaria sino que otro lugar. Es el caso de los campos memo del Dbase. Vuelco o Cheek- point. Sirven para re iniciar procesos interrumpidos, por ejemplo, ltimo registro listado. Rtulos o labels. Contienen informacin bsica del archivo, como por ejemplo, el nombre del archivo. Verificacin. Contiene informacin adicional del archivo, como por ejemplo, cantidad de registros del archivo. Control. Contiene informacin adicional del archivo, como por ejemplo, usuarios autorizados a accesarlos. Estos tres ltimos tipos de registros son bastantes tiles a la hora de mantener los archivos, como tambin con propsitos de seguridad. Es importante destacar que por mltiples motivos jamas nos preocupamos de definir para nuestros procesos estos tipos de registros, sin embargo deberamos hacerlo porque si los tenemos nos ahorrarn muchas hora de trabajo cuando debamos mantener los archivos o frente a una auditora del sistema. Cierto es que tener este tipo de registros consume horas de desarrollo, pero es preferible invertirlas al comienzo cuando recin se esta diseando y desarrollando el sistema. Por ejemplo un registro que nos indique cuantos registros tiene el archivo nos permitir de inmediato saber sobre la integridad de dicho archivo, un registro que nos indique quien fue el ltimo usuario en accesar el archivo nos servir para auditar el uso del archivo, etc.
CONTENIDO
8 de 36
B)
INDICATIVOS. Campos estticos con informacin adicional sobre el ente representado por el registro y que no tienen mayor trascendencia en el procesamiento normal de los registros. Ejemplo, campo sexo. VARIABLES. Valor instantneo de un cierto dato que se modifica frecuentemente Ejemplo. Stock, precio.
C)
CONTENIDO
9 de 36
d)
CONTENIDO ARCHIVOS.
Definiciones: a) Conjunto de registros lgicos referidos a un mismo tipo de informacin. b) Conjunto de registros lgicos referentes a entidades u objetos del mismo tipo.
Un archivo tiene nombre, contenido, direccin donde se guarda y alguna informacin administrativa, por ejemplo, quien lo elabor y cuan grande es. Dependiendo de la configuracin del sistema y del tipo de aplicacin en que se utilice el archivo, todos los procesos pueden realizarse en dos enfoques: Procesos por lotes (en batch). Las distintas transacciones son acumulados y organizadas constituyendo un archivo de transacciones, este archivo se procesa contra el archivo maestro con una periodicidad determinada Ventajas: El archivo de transacciones puede ser verificado, clasificado y ordenado de manera que la eficiencia del proceso sea mxima. El archivo maestro puede re organizarse totalmente durante el proceso de actualizacin, manteniendo as un alta eficiencia de los procesos que involucren este archivo. Permite aumentar el nivel de seguridad de los archivos maestros, ya que estos no se encuentran expuestos permanentemente a los usuarios. Desventaja: La informacin no se encuentra actualizada en los archivos maestros. Procesos en lnea (on line). Las transacciones se procesan en el mismo momento que ellas ocurren, de tal manera que los archivos maestros siempre se encuentran actualizados en su informacin.
10 de 36
No serial.
Cada registro se ubica en una posicin especfica que no depende necesariamente del registro anterior.
Disposicin lgica de los registros. Establece una relacin lgica entre el orden lgico de los registros y la disposicin fsica de los registros. Secuencial: ser aquella en que el orden lgico corresponde con el orden fsico. Al azar: no existe ninguna relacin entre el orden lgico y el orden fsico. Especfico: Secuencial indexado, random, particionado, relativo. Acceso. Corresponde a la forma en que se puede recuperar la informacin de un registro determinado. Serial: para obtener la informacin de un determinado registro ser necesario leer uno a uno los registros que lo preceden fsicamente. Secuencial: Leer uno a uno los registros que lo preceden lgicamente. Directo: Corresponde a una forma de acceso en la cual es posible obtener la informacin de un registro determinado sin acceder a examinar previamente otros registros. Bsqueda binaria: Solo puede aplicarse a archivos que estn en medios de almacenamiento que permitan acceso directo con disposicin fsica serial y disposicin lgica secuencial. Procesamiento. Se refiere al orden en que normalmente sern accesados los registros del archivo. Serial: De acuerdo al orden fsico. Secuencial: De acuerdo al orden lgico. Al azar. Son procesamiento en cualquier orden. Direccionamiento. Es solo aplicable a los archivos almacenados de acceso directo, con disposicin fsica no serial. Se refiere al mtodo que permite determinar la posicin fsica de un registro especfico o de un grupo especfico de registros en donde est el buscado o, dicho de otro modo, se refiere al mtodo que permite determinar la posicin fsica de un registro dentro del archivo. Existen mtodos: desde el ndice, desde la clave, desde la posicin lgica y desde la posicin relativa. Desde el ndice: Consiste en tener almacenado un directorio en que se relacionan las claves de los registros con las direcciones donde estn ubicados, siendo serial la bsqueda dentro de este directorio. DIRECTORIO
CLAVES DIRECCIN
11 de 36
Desde la clave: Consiste en disponer un algoritmo que permite transformar la identificacin lgica o clave del registro en la posicin fsica que ocupa el registro (funcin hashing). Desde la posicin relativa: consiste en determinar la posicin fsica de un registro conociendo el nmero de orden del registro dentro del archivo. El nmero de orden es la posicin relativa del registro dentro del archivo. Para esto es necesario conocer la posicin del primer registro y la cantidad de registros que se pueden almacenar en una pista, un cilindro (en el caso de discos) y de esa forma relativamente directa podemos llegar al registro que se est buscando. En este caso los registros deben ser de longitud fija.
CONTENIDO
12 de 36
La mantencin de archivos est referida a los procesos inusuales pero necesarios para mantenerlos vigentes. La mantencin de archivos puede suceder por variadas causa, como se ver ms adelante. Correctiva Cambios necesarios debidos a errores en el sistema. Adaptativa Relacionado con cambios tecnlogicos y/o organizativos o funcionales de los Sistemas de Informacin. Perfectiva Relacionado con recomendaciones y nuevas posibilidades recibidas de los usuarios y que mejoran la funcionalidad ya existente.
El trmino de mantencin tambin involucra la idea de mantener la informacin a buen resguardo, en este caso se debera hablar de seguridad o proteccin de los archivos y tambin de los respaldos de los archivos. El tema de la seguridad de los archivos es hoy da un tema crtico al que debe drsele la mxima importancia. El trmino de seguridad se emplea para describir la proteccin contra la destruccin de los sistemas y su contenido (por supuesto, los archivos). No se tratar aqu, de algo obvio como es la seguridad de los edificios o de la proteccin de informacin que debe tener cada usuario (se imagina usted que pasara si el operador de un sistema, por descuido, deja en una pantalla el informe del sueldo de los ejecutivos de la organizacin o en un informe impreso las cotizaciones de diferentes proveedores para un sistema estratgico). Si se desea asegurar un SIA, es necesario lograr un modo de operacin confiable y predecible, tambin es necesario proporcionar un mecanismo de proteccin para lograr el control deseado de los accesos de datos. Hoy da, con el nivel de comunicaciones existente, deber asegurarse de que no se presentarn interferencias destructivas ni de accesos no deseados a los archivos o tablas de un sistema de informacin. As la seguridad de los archivos debe ser resguardada externa e internamente a las organizaciones. Los tres temas que deben abordarse en la seguridad son: Confiabilidad: mejorar la probabilidad de que el sistema haga lo que se le indica. La confiabilidad se logra cuando un sistema de computacin, tanto hardware como software produce resultados correctos. Proteccin: comprender, organizar y controlar el acceso a los datos de acuerdo con derechos especficos. Integridad: conservar la seguridad en un sistema en que se permite a mltiples usuarios el acceso al sistema (y compartir los archivos o tablas). El tema de la proteccin de datos tiene dos aspectos El primer aspecto, comnmente entendido es que se desea negar el acceso a las personas que no tengan derecho a ellos. A esto tambin se le denomina comnmente como proteccin de privaca para datos personales y mantenimiento de seguridad para datos gubernamentales o institucionales. El segundo aspecto de la proteccin, igualmente importante, es que es necesario garantizar el acceso a todos los datos importantes a las personas que ejercen adecuadamente su privilegio de acceso. Esto significa que los propietarios de bases de datos tambin tienen la responsabilidad de proteger los datos que se les han confiado. Parte de esta responsabilidad significa que debe existir una operacin confiable de los computadores. El otro aspecto es que
13 de 36
los datos deben estar protegidos de riesgos, vandalismo o alteracin. Ejemplos: Privaca personal. El operador del sistema de remuneraciones, prepara los informes de sueldos del personal, pero el no debe tener acceso a los datos de las entrevistas personales de cuando estos fueron contratados, como por ejemplo los informes psiquitricos. Componentes de los problemas de proteccin. Tres tipos de elementos se combinan para formar el sistema que se utiliza para analizar los mtodos de proteccin. 1.Los usuarios con acceso a los archivos. 2.El tipo de acceso deseado. 3.Los elementos a los que se realizar el acceso. Cada uno de estos elementos debe estar adecuadamente identificado a fin de lograr el control del acceso a los datos. Tambin es necesario considerar el entorno o frontera del rea dentro de la cual es vlido el sistema de proteccin. Definiciones. Entorno: Existe un rea con permetro bien definido, conocido como el sistema de informacin. Usuarios o intrusos. Dentro de esta rea puede haber individuos autenticados adecuadamente identificados, individuos disfrazados de usuarios vlidos, e intrusos. Alcance limitado. El sistema desconoce la identidad de los individuos en el mundo exterior. Privilegios. Existen varios privilegios de acceso a los datos, relacionados con la identificacin de un individuo. La descripcin de estos privilegios se mantiene como parte del sistema de la b de datos. Proteccin. Todos los elementos dato estn protegidos hasta cierto punto mientras se encuentran dentro del rea del sistema de informacin, y perdern toda la proteccin que proporciona el sistema al sacarse del rea. Confiabilidad. Un prerrequisito para lograr la proteccin del SIA es un alto nivel de fiabilidad del sistema. Proteccin, privaca y secreto. La proteccin de los datos requiere ejercer control sobre la lectura, escritura y empleo de esa informacin. Muchos de los mtodos que se analizarn no distinguen entre la proteccin de los datos, el mantenimiento de la privaca y la seguridad del secreto. El secreto se logra cuando no existe acceso a todos los datos sin autorizacin. La privacia adecuada puede lograrse cuando los datos que pueden obtenerse no pueden enlazarse a individuos especficos o no pueden utilizarse para imputar hechos acerca de ellos.
Responsabilidad. No est claro quien, en sentido legal, es responsable por las prdidas sufridas debido a la violacin de las reglas de proteccin de la privaca. En muchas operaciones la responsabilidad corresponde a la alta gerencia, aun cuando ciertas reas especficas pueden delegarse al manejo de procesamiento de datos. TIPOS DE ACCESO A LOS DATOS. Pueden formarse categoras de acceso a los datos por tipo. Por lo comn, las distinciones se realizan entre autorizacin para leer y autorizacin para escribir datos.
14 de 36
Si se desea un control ms exhaustivo se debern tomar en consideracin los siguientes tipos de accesos. Lectura. Ejecucin (sobre un programa que tenga acceso a los datos). Modificar. Eliminar. Ampliar (o agregar datos al archivo). Mover o trasladar (en el nuevo lugar el archivo puede ser copiado). Compartir.
15 de 36
Respaldo: Copia de los archivos que se mantendrn en otro lugar para ser ocupada en caso de error o cada del sistema. Este tema es uno de los que siempre nos olvidamos hasta cuando ocurre algn siniestro. Los archivos de respaldo son copias de los archivos maestros que se guardan por razones de seguridad de los datos. En efecto, si por algn motivo se destruye o altera el archivo original, existen copias para reproducirlo. En la prctica el empleo de volver a leer la entrada de una transaccin o la restauracin de un archivo depende de la disponibilidad de una copia de respaldo de una versin anterior del archivo. Los respaldos deben crearse por copiado. Es posible generar peridicamente copias de respaldo y conservar una serie de versiones anteriores. Cada copia de respaldo deber estar identificada con tiempo, fecha y por la ltima transaccin incluida. Las copias de respaldos deben generarse cuando el sistema esta inactivo, ya que las actualizaciones durante el copiado pueden provocar inconsistencia en la copia. Una buena alternativa de respaldo es jugar con tres versiones de copias, como se muestra en la figura.
Tiempo (periodos)
As, si ocurre algn siniestro y debe subirse un respaldo, se comenzar desde el ltimo realizado, si por algn motivo este no estuviera correcto o no se pudiera subir se recurrir al anterior, si tampoco con este resultara se pueden recurrir al respaldo mas antiguo. Algunas medidas prcticas sobre las copias de respaldos: 1.Las copias deben ser guardadas en un rea distinta en donde se encuentre el procesamiento de datos, ojal en edificios diferentes. 2.Los medios en los que se hacen las copias de respaldo y con los que hacen deben ser de la mejor calidad. Es muy frecuente que a la hora de un siniestro se intente subir un respaldo y el dispositivo presente fallas. 3.Para realizar la copia de respaldo se debe disponer de un tiempo de la mejor calidad, con dedicacin. Es muy frecuente que al subir una copia de respaldo, esta est mal realizada.
CONTENIDO
16 de 36
17 de 36
Se crean especialmente para fines especficos siendo desechados enseguida o siendo mantenidos como respaldo. Son generalmente empleados como actualizadores para otros archivos (maestros) o para obtener informes o archivos intermedios. El contenido de los archivos de transacciones reflejan los hechos acaecidos entre dos procesos consecutivos en un sistema. PASO. Se usan durante un proceso como parte de el y luego se usa en otro proceso del mismo ciclo de operacin sin que permanezca para el ciclo operacional posterior. Ejemplo: Se desean obtener dos listados de alumnos: En orden alfabtico. En orden de nmero de matrcula. Se tiene un archivo maestro ordenado por nmero de matrcula y otro de movimiento ordenado por nmero de matrcula. Transaccin 01 Actualizacin 01 Listado ordenado Nmero matrcula ALUMNOS RESULTADOS o INFORMES. Corresponden a las respuestas del sistema computacional. Su contenido es el resultado del proceso y son usados por personas por lo tanto deben ser percibidos por medios visuales.
18 de 36
CONCATENACIN. Tiene por objeto unir en un solo archivo dos ms archivos iniciales de tal manera que queden ubicados uno a continuacin de otro. INTERCALACIN. Tiene por objetivo permitirla formacin de un archivo ordenado de acuerdo a un criterio, a partir de dos mas archivos iniciales que pueden estar o no en secuencia similar. PAREAMIENTO. Establece una correspondencia entre registros de dos ms archivos. Las coincidencias o discrepancias encontradas proporcionan una pauta para decidir de acuerdo a ciertas reglas si los registros son o no correspondientes. EDICIN. Preparar los datos para la visualizacin por parte de un usuario. Se utiliza normalmente para preparar las impresiones o pantallas de consultas. Pasos previos a una impresin o despliegue: Formateo de registros para la salida. Intercalacin de espacios. Ordenamiento de temes. Insercin de comas. Puntos decimales. Signos especiales. Inserciones de ttulos y sub ttulos. ACTUALIZACIN. Es el proceso computacional de mayor importancia en que intervienen archivos. Esta actualizacin, normalmente, se realiza sobre los archivos maestros. Estos procesos pueden ser en lnea o por lotes. Modificacin de campos variables. Inserciones de registros. Eliminacin de registros. MANTENCIN. Este proceso tambin es tomado como una forma especial de actualizacin, solo que este se realiza espordicamente. Modificacin de campos permanentes. Condensacin de registros o campos. Expansin de registros o campos. Reorganizacin. CLCULO. Son los procesos que graban archivos de paso que tienen en su estructura campos de resultados de calculo, en preparacin de informes. CONVERSIN. Son aquellos procesos cuya finalidad es copiar un archivo de un medio de almacenamiento a otro, de un sistema operativo a otro, de un computador a otro. Este proceso es espordico pero de gran importancia, y como bsicamente se trata de traspasos de SIAs deben tomarse todas las precauciones al hacerlo, siendo una de estas, los respaldos de los archivos que deben perdurar hasta que la nueva aplicacin este corriendo a satisfaccin.
19 de 36
VALIDACIN. Tiene por objeto asegurar, dentro de lo posible, la veracidad e integridad de un conjunto de datos. Adems permite detectar errores y proveen una forma de corregirlos. Tiende a asegurar la exactitud y consistencia, se pueden validar campos y tambin se pueden validar campos contra otros archivos. Los errores deberan indicarse a travs de listados. Todo proceso de validacin debe permitir el feed back, es decir realimentar los registros errneos a los que se les modifica, para que se vuelvan a chequear. Estas validaciones se realizan hasta que no haya mas errores. Chequeos comunes. Dgitos verificadores. Totales de cuadratura. Secuencias de campos. Chequeos orientados a campos. Alfabticos, No alfabticos, Numricos, No numricos, Alfa numricos, Blancos. Chequeos orientados a contenido de campo Cadena de caracteres, Existencia de cadenas de caracteres, Valores dentro de un cierto rango, Valor bajo cierto lmite,Valor sobre un cierto lmite. Chequeos orientados a conjuntos de registros. Antes deben hacerse los chequeos orientados a campos. Verificar el cumplimiento de ciertas relaciones lgicas o aritmticas entre 2 ms campos de un registro. a) Implicacin. Si el contenido de A esta entre tales mrgenes, entonces B est en cuales. b) Disjuncin. El contenido de A est en tal rango o el contenido de B esta en tal otro. c) Conjuncin. El contenido de A est en tal campo y el contenido de B en tal otro. D) Compuesto. (entre los otros). Chequeos orientados a conjuntos de registros. Cantidad de registros de cada tipo, cortes de control, etc. Error de consistencia. Los que se detectan solo al confrontar con otro archivo.
CONTENIDO
20 de 36
ORGANIZACIONES.
Las organizaciones de los archivos se vern en las prximas pginas, en ella aparecen los conceptos de cmo funciona cada organizacin. Dado el avance de las tecnologas informticas muchas cosas ya estn hechas y nosotros solo debemos ocuparlas, sin embargo, es por todos conocido que muchos SIA han fracasado por el desconocimiento de cmo funcionan las diferentes organizaciones implementadas en ellos. Adems, y lo ms importante, es que en muchas situaciones en el desarrollo o mantencin de un SIA deben emplearse artificios en que deben simularse el funcionamiento de una organizacin determinada. Por esto es importante conocer de que trata cada organizacin y como funciona porque as podremos entregar soluciones creativas y eficaces a los problemas informticos. Clasificaciones de las organizaciones: Organizacin lgica: Corresponde al orden en el cual los registros sern procesados por los programas de aplicacin. Organizacin fsica. Corresponde a la forma real en que los registros estn dispuestos sobre el soporte fsico. En muchos casos la organizacin lgica de un archivo es diferente de la organizacin fsica del mismo. Un archivo que tiene una organizacin fsica determinada puede ser utilizado por programas de aplicacin en mas de una forma de organizacin lgica. Organizaciones elementales. Se dice que una organizacin es elemental cuando la estructura lgica es una funcin simple de la estructura fsica. Entre estas organizaciones estn: Secuencial Directa. De lista. Organizaciones complejas. Se dice que una organizacin es compleja cuando la estructura resultante es el resultado de la asociacin de varias organizaciones elementales. Ejemplos de organizaciones complejas son: Relativa. Secuencial indexada. V.S.A.M.
21 de 36
Estos tres tipos de registros son objeto de accesos especiales, sobre todo el ltimo ya que es usual que en los procesos este sea leido pero no procesado. Ventajas: Simple de usar. Ventajosa para porcentajes de actividad alta (taza de utilizacin alta). Alta densidad de informacin. Soportada por todos los medios de almacenamiento. Desventajas. El proceso de actualizacin implica leer y graba todo el archivo. Ineficaz en tazas de utilizacin bajas. ARCHIVO SECUENCIAL. (ejemplo con clave compuesta)
N.reg. 1 2 3 4 5 6 FAMILIA LB004 LC001 MN004 MN004 OP001 WW567 CODIGO 23456-71 45670-92 23234-98 32456-78 09222-67 09223-94 PRECIO 234357 012345 908970 456367 342345 324567 U_MEDIDA C/U CAJAS C/U PQTE PQTE CJTO STOCK 00034 00600 12343 00023 00001 00009
rea primaria. Es un rea dentro de la cual los registros de datos son creados por primera vez o cuando se reorganiza. El archivo al momento de crearse se crea secuencialmente, esto es grabando los registros en el rea primaria en una secuencia dictada por el orden de las claves de los registros. El proceso de grabacin comienza en la segunda pista de un cilindro particular, cuando se termina el cilindro se contina grabando en el cilindro
22 de 36
siguiente a partir tambin de la segunda pista, continuando as hasta terminar con el archivo. rea de ndices. Esta rea es creada por las rutinas del sistema operativo (Data management). Existen varios niveles de ndices involucrados en estos ndices. El nivel de ndices ms bajo es el track index el cual esta siempre grabado en la primera pista de los cilindros, en el cual reside el archivo secuencial indexado. Estos contienen 2 entradas para cada pista primaria del cilindro, una entrada normal y una entrada de overflow. La entrada normal esta compuesta del mayor valor de la clave de los registros almacenados en la pista que identifica ese ndice, y adems en la entrada normal estar registrada la direccin de la pista primaria a la cual esa entrada est asociada. De la misma forma como el track index describe el almacenamiento de registros en las pistas de un cilindro, existir el cilinder index que indicar como los registros estn distribuidos sobre una cierta cantidad de cilindros. Existe un tercer nivel de ndices que es el master index que es usado cuando los archivos son demasiado grandes. En caso de existir el master index este ser la raz del ndice, por lo tanto cualquier bsqueda comenzar en este ndice. rea de overflow. Sirve para agregar o eliminar registros. Estas son pistas de los cilindros, por lo tanto en cada cilindro se dejan una cierta cantidad de pistas para manejar los registros de rebalse, a veces tambin se deja un rea independiente del cilindro para el caso que este se rebalse. En los ndices las entradas de overflow tendrn las claves mas altas de cualquier registro que est en esta pista. Representacin archivo secuencial indexado
094415
1 1 2 3
127362
187169
1)
NDICE DE CILINDRO
3
020028
*
P2
094415
094415
P3
entrada normal
* entrada de overflow
Ejemplo de bsqueda de registros, para claves: 1) 010215 de estar est en cilindro 1. En ndice cilindro 1, de estar est pista 1. Se busca secuencialmente en pista 1. 2) 011124 de estar est en cilindro 1. En ndice cilindro 1, de estar est pista 1. Se busca secuencialmente en pista 1. 3) 023612 de estar est en cilindro 1. En ndice cilindro 1, de estar est pista 2. Se busca secuencialmente en pista 2.
Fracaso.
Fracaso.
xito.
Procesamiento de archivos secuenciales indexados. La gran ventaja de este tipo de organizacin es que el proceso puede ser secuencial o puede ser directo.
23 de 36
En RMCOBOL. ... ENVIRONMENT DIVISION. INPUT-OUTPUT SECTION. FILE-CONTROL. SELECT nombre-archivo ASSIGN TO DISK ORGANIZATION IS INDEXED ACCESS MODE IS {SEQUENTIAL/RANDOM/DYNAMIC} RECORD KEY IS nombre-clave. ... DATA DIVISION. FILE SECTION. FD nombre-archivo ... 01 registro. 02 nombre-clave PIC X. . .X.
CONTENIDO ORGANIZACIN RELATIVA. La organizacin relativa es una organizacin simple y de acceso directo. El direccionamiento de un registro cualquiera se hace en base al primer registro, as existir un primer registro En COBOL Select nombre-interno assign to disk Organization is relative Access mode is sequential / random / dynamic Relative key is identificador. Working-storage section. 77 identificador pic 99999. Procedure division. Open input nombre-interno. Open output nombre-interno. Open i-o nombre interno, Rewrite nombre-registro invalid key sent-imperativa Read nombre-archivo
Organizaciones de listas.
24 de 36
Organizacin directa.
El archivo de organizacin directa no es un desarrollo de las organizaciones anteriores, sino que intenta explotar la capacidad proporcionada por las unidades de disco o dispositivos similares, de lograr acceso a cualquier bloque de direccin conocida, para lograr el direccionamiento directo se utiliza una llave del registro para localizarlo en el archivo. La distribucin de los registros del archivo en el soporte fsico se efecta en funcin de algn atributo de los registros de entrada. A la llave se le aplica una funcin que la transforma en una direccin. Bucket es el espacio fsico de igual direccin que puede contener ms de un registro. Propiedades archivos directos. 1.En los archivos directos el acceso a los registros es rpido especialmente para factores de carga bajos y pocos registros en overflow. (la aparicin de registros de overflow atentan contra del tiempo de bsqueda). 2.Dado que una cierta parte del archivo permanece sin uso (parar prevenir excesivo uso de registros de overflow) la utilizacin de espacio es pobre comparada con la utilizacin de espacio de otras organizaciones. 3.El rendimiento (PERFORMANCE) obtenido usando un archivo directo es muy dependiente del algoritmo de transformacin usado hashing). 4.los registros de un archivo directo pueden ser accesados en forma randomica o serial, pero nunca secuencial a menos que se mantenga una lista separada ordenada por claves, es decir una lista ordenada en otro archivo. Ventajas. Esta organizacin es muy til para los procesos en lnea, para archivos que no son muy voltiles.
Tcnicas de resolucin de colisiones. En un archivo directo la unidad mnima direccionable es el bucket. Al establecer un tamao del bucket se espera una cierta cantidad de sinnimos. Cuando hay ms registros sinnimos que los del bucket dado entonces algn mtodo debe ser usado para manejar estos registros de overflow. Open addressing. Cuando un registro va a un bucket que no esta completo este se ubica en la siguiente posicin disponible en el bucket, este ser su bucket primario; si un registro no esta en el bucket primario este podra estar en el bucket de overflow. Una bsqueda sucesiva es hecha de los registros en los bucket restantes del archivo, esta bsqueda termina al encontrar el registro o un registro en blanco, o si la bsqueda vuelve al registro original. Encadenamiento. i) Los registros de overflow pueden ser encadenados desde un rea primaria a un rea separada de overflow, una buena estrategia podra ser dejar los ltimos bucket de un rea para overflow. ii) Encadenamiento con lista. Con este mtodo los registros de overflow son ubicados usando punteros desde un bucket a otro. Cuando una clave es mapeada a un bucket,
25 de 36
una bsqueda comienza a travs de una cadena de bucket hasta que el registro requerido o una posicin vaca es encontrada.
Lo que significa un catalogo por usuario y lgicamente permitir una mayor y mejor proteccin de la informacin. Portabilidad de archivos ya que los archivos pueden ser llevados de un lugar a otro.
26 de 36
VSAM obtiene los registros de un archivo mediante el desplazamiento de un registro a partir del comienzo del archivo (direccionamiento relativo).
MASTER CATALOG
USER CATALOG
Archivos VSAM
archivos NO VSAM
Archivos VSAM
archivos NO VSAM
VSAM requiere de un software que se llama ACCESS METHOD SERVICE (AMS) que es el que crea los archivos VSAM, adems de permitir conversiones entre archivos secuenciales, o secuenciales indexados a VSAM. ESTRUCTURAS DE LOS ARCHIVOS VSAM. Los archivos VSAM tienen varias caractersticas orientadas a mejorar el desempeo en trminos de tiempo de ejecucin. El tamao del nodo de rbol esta definido como una pgina de memoria virtual, de esta manera se maximiza el tamao que el hardware puede manejar eficientemente, reduciendo as el nmero de nodos que requiere el rbol y por ende el numero de accesos a los dispositivos perifricos. La ventaja de organizacin de rbol es que esta no requiere ser reorganizada peridicamente.
NDICE DE RBOL
NODOS DE DATOS
Existen 3 tipos de archivos VSAM los KSDS, ESDS y RRDS. KSDS (key sequenced data set secuencial indexado). Se puede crear registros de formato variable y fijo. Son exclusin de la clave cualquier campo puede ser modificado.
27 de 36
Los registros de longitud variable puede ser acortados o expandidos. Los registros son cargados en registros ordenados definidos por el contenido de un campo clave de cada registro y el acceso a los registros de este archivo puede ser en forma directa (va la clave) o en forma secuencial (va el orden lgico de la clave) o incluso va el RBA (Relative Byte Address). Caractersticas. Ordenados secuencialmente por clave. Acceso por medio de Indices. Clave de longitud fija. Crear modificar eliminar. Puede reservar un espacio libre para adicionar registros. Un archivo VSAM, KSDS esta compuesto de reas contiguas de largo fijo de un medio de almacenamiento DASD (Direct Access Storage Device) llamados Control Internal (CI). Un CI (siendo un rea de almacenamiento) corresponde a la unidad de informacin que es transferida desde o hacia el almacenamiento externo o memoria por medio de las posibilidades de acceso de VSAM. Los registros en un CI pueden ser de largo fijo o variable y un CI tiene la siguiente estructura. CI
REG.1 REG.2 REG.3
...
REG.N
Espacio libre
INFO DE CONTROL
La INFO DE CONTROL es la longitud de registro cuando se trate de registros de longitud variable. La reunin de los DATA RECORD con su respectivo INFO de CONTROL es la STORED RECORD. El espacio libre en un archivo KSDS puede estar distribuido de 2 maneras. Espacio libre al final de cada CI. CI completo libres. VSAM considera los CI como si estuvieran contiguos y trata un archivo como si este estuviera almacenado en memoria virtual partiendo de la direccin 0 (cero).
ARCHIVO
CA 1
CA 2
CA 3
...
CI 3
CA n
CI 1
CI 2
Reg. 1
Reg. 2
......
Reg. n
INFO DE CONTROL
Un conjunto de CI pueden ser agrupados lgicamente para formar un CONTROL- AREA. Un conjunto de ndices es creado para cada CA y adems un conjunto particular contiene punteros a los CI que dependen de los CA. Los ndices para un CA forman un SSE (Sequenced Set Elements) y el conjunto de SSE forma un sequence set. Tambin se pueden construir ndices para un nivel superior y eso se llama un INDEX SET que va a contener un registro para cada SSE.
28 de 36
Los archivos VSAM KSDS pueden ser procesados en 3 formas. Sequential. Skip sequemtial. Directo.
95 200 310 3
SET INDEX
30
73
95
112
170
200
240
273
310
12
30
FS
50
65
73
87
95
FS
SEQUENCE SET
CI
CI
23 18 30
CI FS
12 FS
FS
CA (Control Area)
Sequential. En este caso el proceso accesa los registros de acuerdo a la secuencia de clave del archivo. Se puede especificar en VSAM una clave especfica o genrica con la 1ra. sentencia de Inputoutput que aparezca en el programa lo que provocar que el procesamiento secuencial comenzar desde una clave especifica o desde la 1 ra. clave genrica. clave especfica -- cdigo. clave genrica -- apellido. Skip sequential. Involucra el acceso en orden de un sub conjunto de registros del archivo. Asumamos que tenemos un sub conjunto ordenado de la claves, para procesar estos registros cuyas claves estn ordenadas en VSAM es posible usar los link horizontales entre SSE en el sequenced set. Directo. Este acceso se logra por el recorrido del rbol de ndices. El CI apropiado es recuperado y el registro deseado es accesado en memoria virtual. Administracin de datos. Deleteo. El espacio ocupado por el registro es recuperado y agregado al espacio libre del CI (se hace un reformateo).
29 de 36
Esto acarrea por supuesto una actualizacin de ndices. Insercin. Si no hay espacio, entonces se usa un CI adicional, llamado CI split El nuevo registro es puesto en el lugar que corresponde por movimiento de los otros registros. Para cuando no quedan ms CI libres y se debe insertar un nuevo registro existe un overflow de CA. ESDS (Entry Sequenced Data Set). A diferencia de los archivos KSDS los ESDS no tienen ndices asociados es decir no se puede accesar en forma directa, sino que la nica forma de acceso es va la RBA. Caractersticas. Acceso secuencial. No hay espacios libres reservados. Adicin de registros siempre al final fsico del archivo de datos. Solamente permite actualizaciones. No permite eliminar registros. Los registros que se crean son cargados consecutivamente cuando un CA esta completo un nuevo CA es abierto. Un registro puede ser modificado secuencialmente o selectivamente. El largo de un registro puede ser modificado. RRDS (Relative Records Data Set). Caractersticas. Solo puede ser soportado por el Assembler. Organizacin para registros de longitud fija. Los registros son cargados en casilleros (slots), un slot puede estar ocupado o libre. Los registros pueden ser cargados secuencialmetne o selectivamente. Las modificaciones son posibles. Las eliminaciones son posibles y el slot correspondiente queda disponible. CONCLUSIN archivos VSAM. Si bien es cierto que los archivos VSAM en la actualidad se usan poco, es difcil que ellos pierdan vigencia, no por su utilidad sino que por sus conceptos. El analista programador pasar la mayor parte de su vida profesional creando archivos a los que debe darles organizaciones especficas, estas organizaciones debern responder a diferentes requerimientos como son los tiempos de respuesta, almacenamiento, comunicaciones, etc. es all en donde debe emplear todos los conceptos que se han mostrado de las diferentes organizaciones para obtener el ms alto rendimiento de los sistemas. Sus soluciones propuestas debern ser creativas, amalgamando organizaciones de distinto tipo, debiendo evaluar si deber sacrificar el llegar a un estado ptimo de normalizacin produciendo una cierta redundancia, si es que el requerimiento as lo exige.
CONTENIDO
30 de 36
1.-
Ejercicios.
Para los siguientes archivos: Archivo: Alumnos.dat Organizacin: Secuencial indexada. Campos: Rut 9(8). Nombre x(25). Cdigo de carrera 99. Direccin x(20). Ciudad x(10). Archivo: Carreras.dat Organizacin: Secuencial. Campos: Cdigo de carrera 99. Nombre de carrera x(15). El (los) programa (s) deber (n) permitir. Ingresar y/o eliminar alumnos, modificar el campo direccin. Listar alumnos por carreras, ordenados alfabticamente. Listar alumnos que vivan en una ciudad. Listar alumnos de una carrera cualquiera, a partir: -De un nombre. -De un RUT. Todos los listados pueden ser en orden creciente o decreciente. Problema Defina la estructura de los archivos y los procesos para obtener las salidas solicitadas. En una empresa de envos de giros usted debe crear un sistema a partir de los siguientes archivos: Archivo: CLIENTES.DAT Organizacin: Campos: RUT cliente x(8) Razn social x(40) Forma de pago xx. (1 al contado, 2 cta. cte., 3 con cheque a fecha, 4 SALIDAS.
2.-
Defina los campos faltantes, procesos, campos claves, archivos (no maestros) y programas para satisfacer los siguientes requerimientos.
-
1 Validar que los productos registren la ltima compra o venta, si no fuera as deber corregir el archivo de productos (procesar contra archivos MOVIMIENTOS). 2 Pantalla de consulta con ltimas 5 compras realizadas para un producto solicitado.(rut prv., fecha, valor, cantidad, etc.). 3 Listar inventario valorizado por nombre de familia de productos.
31 de 36
4 Listar inventario valorizado en orden creciente de cdigo de productos a una fecha determinada. 5 Pantalla de consulta de productos, si tiene stock 0, mostrar productos alternativos. 6 Para un proveedor mostrar una compra determinada (= proveedor, = nro, factura). 7 Listar en orden decreciente por monto de compra, los 5 proveedores (de mayor monto de compra) a los que se les ha comprado a partir de una fecha determinada. 8 Listar, en orden decreciente, las ubicaciones con su valor de inventario. 9 Listar los productos con mayor rotacin (los que ms se compran) a partir de una fecha determinada. 10 Listar los Rut de clientes en orden decreciente de compra a partir de una fecha determinada. 11 Defina un proceso que verifique que los precios de venta de los productos son los que corresponden. NOTAS: Puede haber familias que no tengan productos. Puede haber productos que estn en el archivo COMPRAS y que no estn en el archivo PRODUCTOS. Los valores de venta de cada producto estn asociados a un porcentaje que depende de la familia de productos. La valorizacin de inventario debe hacerse con el ltimo precio de compra que exista. -
Defina los campos faltantes, procesos, campos claves, archivos (no maestros) y programas para satisfacer los siguientes requerimientos.
-
1 Validar que los productos registren la ltima compra, si no fuera as deber corregir el archivo de productos (procesar contra archivos VENTAS y COMPRAS). 2 Pantalla de consulta con ltimas 5 compras realizadas para un producto solicitado.(rut
prv., fecha, valor, cantidad, etc.).
3 Listar inventario valorizado por familia de productos. 4 Listar inventario valorizado en orden creciente de cdigo de productos a una fecha determinada. 5 Pantalla de consulta de productos, si tiene stock 0, mostrar productos alternativos. 6 Para un proveedor mostrar una compra determinada (= proveedor, = nro, factura). 7 Listar en orden decreciente por monto de compra, los 5 proveedores (de mayor monto de compra) a los que se les ha comprado a partir de una fecha determinada.
32 de 36
8 Verificar que para los productos alternativos estos sean de la misma familia que los originales. 9 Listar, en orden decreciente, las ubicaciones con su valor de inventario. 10 Listar los productos con mayor rotacin (los que ms se compran) a partir de una fecha determinada. 11 Listar los productos que han generado mayor ganancia a partir de una fecha determinada. NOTAS: Puede haber familias que no tengan productos. Puede haber productos que estn en el archivo COMPRAS y que no estn en el archivo PRODUCTOS. Los valores de venta de cada producto estn asociados a un porcentaje que depende de la familia de productos. -
CONTENIDO
33 de 36
En una empresa dedicada a la comercializacin se ha credo que la importancia de los clientes es estratgica para el desarrollo y crecimiento de la organizacin, es as como se le da una importancia capital al registro de estos.
Archivo: CLIENTES.dat. Organizacin: Directa. (registro fsico de al menos 5 registros lgicos) Campos: RUT 9(8) Fecha de incorporacin 9(8) (SSAAMMDD) comp-3. Direccin X(35). Ciudad X(20). Telfono X( E-mail X(35). Estado civil X Fecha de nacimiento 9(8) (SSAAMMDD) comp-3. ltimas 5 compras - Tipo de documento - Nmero de documento. Tipo de cliente X (A, B, C). Archivo: ITEMES.dat Organizacin: Eljala usted. Campos: Cdigo Descripcin Unidad de medida Valor costo Stock por bodega (3) Porcentaje venta por tipo cliente (ocurre 3)
Archivo: VENTAS.dat Organizacin: Secuencial indexada. Campos: Tipo documento (Boleta, Factura). X Nmero de documento 9(7) Fecha de emisin 9(8) (SSAAMMDD) comp-3. Rut cliente Forma de pago (Contado, cRdito, cTa.cte.) X Archivo: MOVIM.DAT Organizacin: eljala usted. Campos: Tipo documento Nmero de documento Cantidad Cdigo artculo Defina y los procesos y programas para: Actualizar archivos maestros (clientes e itemes). Adems los clientes tambin pueden ser incorporados en el momento de la venta. Para efectuar ventas.
34 de 36
Para consultar un documento. Para mostrar una de las ltimas 5 ventas de un cliente. Eliminar clientes eligindolo directamente y tambin en un proceso batch y transparente en que son eliminados todos los clientes que no han comprado en los ltimos 6 meses.
35 de 36
BIBLIOGRAFA.
1.2.3.4.Prez, Victor & Pino Jos, Curso de computacin e informtica, Volumen IV, Ed. Universitaria, 1982. Owen Hanson, Design of computer Data Files. 1982. Bravo C., Juan; Desarrollo de sistemas de Informacin.,1988, Editorial universitaria. Wiederhold, Gio; Diseo de Bases de Datos, 2da. Ed., McGraw Hill, 1986
Kort, Henry & Silberschatz, Abraham; Fundamentos de bases de Datos; McGraw Hill; 2da. Ed; 1993 Joyanes, Luis & Zahonero, Ignacio; Estructura de Datos;Mc Graw Hill; 1999 Loomis, Mary, Estructura de datos y organizacin de archivos; 2da Ed; prentice hall, 1991 Archivos de referencias cruzados. Es semejante al archivo bsico pero est clasificado por otro argumento. Ej. N.cuenta Nombre Saldo Fecha mov. Arch ref.cruzada. Nombre N.cuenta.
36 de 36