La tabla de extracción de campos (FST)

From ABCD Wiki
Revision as of 13:02, 25 November 2013 by Guilda (talk | contribs) (Página creada con «La tabla de extracción de campos es el archivo utilizado en las estructuras CDS/Isis para actualización y mantenimiento de las índices de búsqueda (listas invertidas) a...»)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search

La tabla de extracción de campos es el archivo utilizado en las estructuras CDS/Isis para actualización y mantenimiento de las índices de búsqueda (listas invertidas) así como en los procesos relacionados con el intercambio de información o la generación de claves para ordenar alfabéticamente los reportes de salida. Al construir la tabla de extracción de campos el diseńador de la base de datos ha de tener en mente los tipos de búsqueda que quiere habilitar para los usuarios de la información e intentar que las consultas recuperen información, siempre que sea posible. CDS/Isis proporciona un gran número de facilidades para garantizar el éxito de los procesos de recuperación de información, como son:

  • 8 técnicas de indización diferentes, de tal forma que un mismo campo puede ser almacenado en los índices de diferentes manera
  • La extracción de claves se formula a través del lenguaje de formatos, lo que permite analizar y realizar transformaciones sobre los datos antes de enviarlos a los índices
  • Transparencia en el uso de mayúsculas, minúsculas o caracteres acentuados en los términos de búsqueda
  • Identificación de las claves de búsqueda, lo cual facilita determinar el orígen (mfn, campo, ocurrencia y posición relativa dentro del campo) de cada uno de los términos contenidos en el diccionario

La tabla de extracción de campos es un archivo del tipo TXT el cual consta de tres columnas donde se identifican los siguientes elementos:

ID Identificación de la clave

Identifica la etiqueta (tag) del campo que se utilizará para identificar el término.

TI Técnica de indización

Especifica la técnica de indización a aplicar sobre las líneas obtenidas luego de la aplicación del formato de extracción sobre cada registro de la base de datos

Formato de extracción

Indica el formato de extracción a aplicar sobre el registro para obtener la clave


ID Identificación de la clave

Las claves del archivo de índices (listas invertidas) de las estructuras CDS/Isis constan de cinco elementos:

         Término de búsqueda (clave)
         ID
         Mfn
         Número de Ocurrencia
         Número de Secuencia