Elaboración de índices ò estructura a los documentos, representación alterna a partir de las palabras clave ordenadas. En los SRI, permiten realizar operaciones de búsqueda, comparar documentos. - Archivos Invertidos: Mecanismo para identificar términos y palabras clave posición de caracteres-palabras, indexar una colección.
- Ocurrencias: Lista de apariciones de cada palabra.
- Proceso de Marcado: Se realiza mediante una herramienta de Corpus Textual, es el Análisis lingüístico del conjunto de palabras clave del documento ej: TENK-TEXT, que contiene un icono Wordlisted, encargado de determinar el numero de veces en que se repite cada palabra.
- Concordancia: Análisis estadístico de las palabras antes y después de los términos (antecesor y predecesor)
- Palabras Vacías: No dicen nada ej.: lo, las, es, un… etc.
- Lematización: clasificación y eliminación de plurales, así facilitar la recuperación de la información.
No hay comentarios:
Publicar un comentario