Difference between revisions of "Archivos de datos"

From ABCD Wiki
Jump to: navigation, search
Line 1: Line 1:
 
+
==Estructura de los archivos de datos==
 
El almacenamiento de los datos en CDS/ISIS se lleva a cabo en una entidad lógica que comprende dos archivos físicos: el archivo maestro,con la extensión '''.MST'''  y el archivo de referencias, con la extensión '''.XRF'''.  
 
El almacenamiento de los datos en CDS/ISIS se lleva a cabo en una entidad lógica que comprende dos archivos físicos: el archivo maestro,con la extensión '''.MST'''  y el archivo de referencias, con la extensión '''.XRF'''.  
 
Los datos se almacenan en el archivo maestro y el archivo de referencias es un archivo auxiliar que provee un mecanismo para el procesamiento de las operaciones de entrada y salida del archivo maestro.
 
Los datos se almacenan en el archivo maestro y el archivo de referencias es un archivo auxiliar que provee un mecanismo para el procesamiento de las operaciones de entrada y salida del archivo maestro.
 +
 
El archivo de referencias se forma con registros de longitud fija, uno por cada registro del archivo maestro, y contienen la ubicación de cada registro dentro del maestro, permitiendo de esta forma  acceso directo a los registros.  Además de la dirección, se almacena el estado de cada registro: activo, lógicamente eliminado o físicamente eliminado. También indica si las listas invertidas ya han sido actualizadas con el registro en referencia.
 
El archivo de referencias se forma con registros de longitud fija, uno por cada registro del archivo maestro, y contienen la ubicación de cada registro dentro del maestro, permitiendo de esta forma  acceso directo a los registros.  Además de la dirección, se almacena el estado de cada registro: activo, lógicamente eliminado o físicamente eliminado. También indica si las listas invertidas ya han sido actualizadas con el registro en referencia.
 
Los registros del archivo maestro son de longitud variable y cada uno de ellos se identifica con un número secuencial llamado “master file number” (MFN) o número de registro en el archivo maestro.  
 
Los registros del archivo maestro son de longitud variable y cada uno de ellos se identifica con un número secuencial llamado “master file number” (MFN) o número de registro en el archivo maestro.  
Line 24: Line 25:
  
  
NTEGRIDAD DEL ARCHIVO DE DATOS
+
==Integridad del archivo maestro ==
Dada la estrecha relación entre el archivo maestro y el archivo de referencias, la integridad de los datos en las estructuras CDS/Isis depende de la integridad de estos dos archivos: si el archivo .xrf se corrompe, el archivo maestro también se verá como corrompido aun cuando los datos están físcamente correctamente almacenados. Existen programas que ayudan a r2stablecer el archivo .xrf a partir del archivo maestro, para recuperar, en esta forma, la integridad de la base de datos que parezca corrompida. Uno de estos programas es el denominado MKXRF perteneciente a las librerías CIsis distribuídas por Bireme. Es mi experiencia a través de muchos ańos de trabajo con las estructuras CDS/Isis, que en la mayoría de los casos cuando el archivo  .mst aparece corrompido, los que se está reflejando es la corrupción del archivo .xrf; por lo tanto, al recuperando el xrf también se recupera el .mst.
+
Dada la estrecha relación entre el archivo maestro y el archivo de referencias, la integridad de los datos en las estructuras CDS/Isis depende de la integridad de estos dos archivos: si el archivo .xrf se corrompe, el archivo maestro también se verá como corrompido aun cuando los datos están físcamente correctamente almacenados. Existen programas que ayudan a restablecer el archivo .xrf a partir del archivo maestro, para recuperar el acceso a la base de datos. Uno de estos programas es el denominado MKXRF perteneciente a las librerías [http://wiki.bireme.org/es/index.php/CISIS CISIS] distribuídas por Bireme.  
 +
 
 
  La mejor manera de protejer los datos es asegurar el respaldo conjunto de los archivos .mst y .xrf, tener definidos procedimientos de auditoría y saber aplicar las herramientas de recuperación de bases de datos que ya existen para el mantenimiento de estas estructuras.
 
  La mejor manera de protejer los datos es asegurar el respaldo conjunto de los archivos .mst y .xrf, tener definidos procedimientos de auditoría y saber aplicar las herramientas de recuperación de bases de datos que ya existen para el mantenimiento de estas estructuras.
EL REGISTRO DE CONTROL DEL ARCHIVO MAESTRO
+
 
Todo archivo maestro posee un registro con MFN 0 denominado Registro de control del archivo maestro. Siempre se almacena al inicio del archivo, posee longitud fija y no genera entrada alguna en el archivo de referencias.
+
 
El registro de control almacena la siguiente información
+
==El registro de Control del Archivo Maestro==
Número de archivo maestro (siempre cero)Próximo Mfn a ser asignadoDirección del próximo registro disponible: apunta al inicio del próximo bloque de 512 bytes disponibleDirección del próximo registro del archivo maestro (apunta al desplazamiento dentro del próximo bloque disponible)Tipo de archivo maestro (siempre es cero)Número de aplicaciones que han solicitado el bloqueo de entrada de datosIndicador de bloqueo de lectura de la base de datos
+
Todo archivo maestro posee un registro con MFN 0 denominado '''Registro de control del archivo maestro'''. Siempre se almacena al inicio del archivo, posee longitud fija y no genera entrada alguna en el archivo de referencias. Almacena la siguiente información
Las librerías de IsisDll permiten consultar este registro de control.
+
*Número de archivo maestro (siempre cero)
 +
*Próximo Mfn a ser asignado
 +
*Dirección del próximo registro disponible: apunta al inicio del próximo bloque de 512 bytes disponible
 +
*Dirección del próximo registro del archivo maestro (apunta al desplazamiento dentro del próximo bloque disponible)
 +
*Tipo de archivo maestro (siempre es cero)
 +
*Número de aplicaciones que han solicitado el bloqueo de entrada de datos
 +
*Indicador de bloqueo de lectura de la base de datos
 +
 
 +
 
 
== ESTRUCTURA DE LOS REGISTROS DEL ARCHIVO MAESTRO ==
 
== ESTRUCTURA DE LOS REGISTROS DEL ARCHIVO MAESTRO ==
 
En los registros del archivo maestro la información se organiza en campos de longitud variable y algunos son opcionales, esto es, no siempre están presentes en todos los registros.  
 
En los registros del archivo maestro la información se organiza en campos de longitud variable y algunos son opcionales, esto es, no siempre están presentes en todos los registros.  
Line 38: Line 48:
 
*Directorio
 
*Directorio
 
*Area de Datos
 
*Area de Datos
 +
 
Los datos son almacenados en el área de datos uno a continuación del otro, sin ningún separador entre ellos. La sección de directorio contiene entradas de longitud fija las cuales almacenan apuntadores hacia cada campo contenido en el área de datos. El Leader también posee longitud fija y contiene información acerca de las características generales del registro en sí mismo, tales como: número de archivo maestro (MFN),  longitud de registro, el número de campos almacenados, etc. En forma esquemática la estructura de un registro es la siguiente
 
Los datos son almacenados en el área de datos uno a continuación del otro, sin ningún separador entre ellos. La sección de directorio contiene entradas de longitud fija las cuales almacenan apuntadores hacia cada campo contenido en el área de datos. El Leader también posee longitud fija y contiene información acerca de las características generales del registro en sí mismo, tales como: número de archivo maestro (MFN),  longitud de registro, el número de campos almacenados, etc. En forma esquemática la estructura de un registro es la siguiente
 +
 +
[[Archivo:Mst03.jpg|centro]]

Revision as of 10:33, 21 December 2013

Estructura de los archivos de datos

El almacenamiento de los datos en CDS/ISIS se lleva a cabo en una entidad lógica que comprende dos archivos físicos: el archivo maestro,con la extensión .MST y el archivo de referencias, con la extensión .XRF. Los datos se almacenan en el archivo maestro y el archivo de referencias es un archivo auxiliar que provee un mecanismo para el procesamiento de las operaciones de entrada y salida del archivo maestro.

El archivo de referencias se forma con registros de longitud fija, uno por cada registro del archivo maestro, y contienen la ubicación de cada registro dentro del maestro, permitiendo de esta forma acceso directo a los registros. Además de la dirección, se almacena el estado de cada registro: activo, lógicamente eliminado o físicamente eliminado. También indica si las listas invertidas ya han sido actualizadas con el registro en referencia. Los registros del archivo maestro son de longitud variable y cada uno de ellos se identifica con un número secuencial llamado “master file number” (MFN) o número de registro en el archivo maestro.

centro

Los registros se almacenan secuencialmente en el archivo maestro y su posición física dentro al interior de éste se guarda en el registro correspondiente del archivo de referencias. Esto es, la dirección y estado del registro 1 del archivo maestro se encuentra almacenada en la posición 1 del archivo de referencias, la dirección y estado del registro 2 del archivo maestro se encuentra almacenada en la posición 2 del archivo de referencias ... y así sucesivamente. Los nuevos registros se van agregando al final del archivo maestro, creándose el registro correspondiente en el archivo de referencias.

Como la estructura del maestro mantiene registros de longitud variable, en el proceso de actualización de registros ya existentes se da un caso especial: si se edita un registro ya almacenado el mismo puede no ocupar la misma posición que tenía asignada en la base de datos, dependiendo de las siguientes condiciones:

  • Si la versión modificada del registro tiene una longitud mayor que la versión anterior del mismo, entonces el registro se graba de nuevo al final de la base de datos y la versión anterior del registro se marca para indicar que el mismo está deshabilidado. El archivo de referencias se modifica para colocar la nueva posición del registro dentro de la base de datos.
Ejemplo: supongamos que al Mfn 4 tiene una longitud de 215 bytes. Lo editamos para agregar dos descriptores más, con lo cual la nueva longitud del registro es de 248 bytes. Cuando intentamos actualizar el registro, éste no puede sobreescribirse en el mismo lugar que ocupaba la versión de 215 bytes. Entonces, el registro de 215 bytes es marcado como eliminado y la nueva versión del registro se graba al final de la base de datos. El archivo .xrf también es modificado para indicar la nueva posición del registro 4 dentro del archivo maestro. Podemos representar esta situación de la siguiente manera:

centro

En la nueva versión del Mfn 4 se graba un apuntador hacia su versión anterior. Esto con el objeto de permitir extraer las claves de la lista invertida, correspondientes a la versión anterior del registro, para luego agregar las nuevas claves.Al actualizarse la lista invertida el apuntador hacia a la versión no modificada del registro desaparece.
  • Si la longitud de la versión modificada del registro no sufre ningún incremento, la lista invertida no ha sido actualizada y es la segunda modificación que ocurre sobre el registro, el registro modificado puede sobreescribir su versión anterior ya que las versiones intermedias generadas entre la primera versión y la última versión del registro no necesitan almacenarse para actualizar la lista invertida por cuanto con las dos versiones extremas basta para mantener actualizados los índices.

Las versiones del registro que han sido objeto de modificación permanecen en la base de datos hasta tanto no se active un proceso de reorganización del archivo maestro.

Todos los productos de la familia CDS/ISIS proveen funciones para las operaciones de entrada y salida de registros, las cuales manejan en forma automática el almacenamiento físico de los archivos maestro y de referencia y sus correspondientes mecanismos de actualización.


Integridad del archivo maestro

Dada la estrecha relación entre el archivo maestro y el archivo de referencias, la integridad de los datos en las estructuras CDS/Isis depende de la integridad de estos dos archivos: si el archivo .xrf se corrompe, el archivo maestro también se verá como corrompido aun cuando los datos están físcamente correctamente almacenados. Existen programas que ayudan a restablecer el archivo .xrf a partir del archivo maestro, para recuperar el acceso a la base de datos. Uno de estos programas es el denominado MKXRF perteneciente a las librerías CISIS distribuídas por Bireme.

La mejor manera de protejer los datos es asegurar el respaldo conjunto de los archivos .mst y .xrf, tener definidos procedimientos de auditoría y saber aplicar las herramientas de recuperación de bases de datos que ya existen para el mantenimiento de estas estructuras.


El registro de Control del Archivo Maestro

Todo archivo maestro posee un registro con MFN 0 denominado Registro de control del archivo maestro. Siempre se almacena al inicio del archivo, posee longitud fija y no genera entrada alguna en el archivo de referencias. Almacena la siguiente información

  • Número de archivo maestro (siempre cero)
  • Próximo Mfn a ser asignado
  • Dirección del próximo registro disponible: apunta al inicio del próximo bloque de 512 bytes disponible
  • Dirección del próximo registro del archivo maestro (apunta al desplazamiento dentro del próximo bloque disponible)
  • Tipo de archivo maestro (siempre es cero)
  • Número de aplicaciones que han solicitado el bloqueo de entrada de datos
  • Indicador de bloqueo de lectura de la base de datos


ESTRUCTURA DE LOS REGISTROS DEL ARCHIVO MAESTRO

En los registros del archivo maestro la información se organiza en campos de longitud variable y algunos son opcionales, esto es, no siempre están presentes en todos los registros. La estructura del registro del archivo maestro posee tres secciones:

  • Leader
  • Directorio
  • Area de Datos

Los datos son almacenados en el área de datos uno a continuación del otro, sin ningún separador entre ellos. La sección de directorio contiene entradas de longitud fija las cuales almacenan apuntadores hacia cada campo contenido en el área de datos. El Leader también posee longitud fija y contiene información acerca de las características generales del registro en sí mismo, tales como: número de archivo maestro (MFN), longitud de registro, el número de campos almacenados, etc. En forma esquemática la estructura de un registro es la siguiente

centro