lunes, 8 de febrero de 2010

ITEMS IMPORTANTES



  • Documento Estructurado: Limita sus componentes, estructura y campos.

  • Documento No estructurado: No tiene nivel de estructura, ni orden.

  • Documento semi estructurado: No tiene nivel de cumplimiento no posee certeza.
- Descriptor: Palabras normalizadas (Semánticas)

- Encabezamiento de Materia: Significado de las Palabras (Sintácticas)

- Palabras Clave: Extraer palabras de un texto expresadas por un lenguaje coloquial-natural ubicadas por la máquina.

- Etiqueta: Conjunto de las palabras que provienen de un texto, Lenguaje natural.

  • GEL – XML: Lenguaje estándar q soporta el intercambio de información “normalizar documentos” interconectados constantemente. Ej: codificación Word y Bloc de notas.

No hay comentarios:

Publicar un comentario