Recuperacion y Organizacion de la Informacion

Recuperación y extracción de información

Dentro de los sistemas de recuperación y acceso a la información, se puede hacer una clara diferenciación entre recuperación y extracción de información.

Los sistemas de recuperación de información se encargan de procesar una colección de textos y entre todos ellos seleccionar aquellos que contengan algún término relacionado con la pregunta y descartando los que no estén relacionados.

Los sistemas de extracción de información, al contrario que los sistema anteriores, parten de una colección de textos pertenecientes todos a un mismo dominio y que contiene información considerada relevante para la aplicación. Estos sistemas tienen como objetivo principal localizar en los textos determinada información para poder rellenar una base de datos a la que podamos hacer preguntas. Con ello se consigue transformar información no estructurada en información estructurada.

Recuperación y extracción de información mediante clasificación supervisada

Este tipo de extracción o recuperación de información esta basada en el aprendizaje de forma supervisada. Este aprendizaje se basa en un algoritmo que genera una función para establecer una correspondencia entre las entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo es el problema de clasificación, donde el sistema de aprendizaje trata de etiquetar (clasificar) una serie de vectores utilizando una entre varias categorías (clases). La base de conocimiento del sistema está formada por ejemplos de etiquetados anteriores.

En este wiki se presentarán una serie de métodos de extracción y recuperación de información basados en clasificación supervisada.

Modelos ocultos de Markov: Son modelos que asumen que el sistema estudiado sigue un proceso de Markov con parámetros desconocidos.
Árboles de decisión : Trabaja asignando pesos no binarios a los términos índice de las preguntas y de los documentos. Estos pesos se utilizan para comprobar el grado de similitud entre un documento guardado en el sistema y la pregunta realizada por el usuario.
Perceptrón simple y multicapa: Dos tipos de redes neuronales con aprendizaje de manera supervisada.
LVQ: Modelo de clasificación supervisada por vecindad que utiliza redes de cuantización vectorial. La fase de aprendizaje se basa en ejemplos que luego no vuelven a ser utilizados.

Extraccion y Recuperacion de Informacion II

Recuperación y extracción de información

Recuperación y extracción de información mediante clasificación supervisada

Enlaces relacionados