Recuperacion y Organizacion de la Informacion

Modelos ocultos de Markov

Los modelos ocultos de Markov fueron desarrollados por A. Markov en 1913 para modelizar secuencias de palabras en ruso y en la actualidad se usan como herramienta estadística de propósito general. Se formaliza la etiquetación como un proceso doblemente aleatorio parametrizable (los parámetros se pueden estimar de forma precisa en el entrenamiento) en el que el modelo del lenguaje es representado por un autómata finito probabilista.

El objetivo de un modelo oculto de Markov es determinar los parámetros desconocidos en un proceso de Markov de parámetros desconocidos a partir de ciertos parámetros observables. Los parámetros obtenidos se pueden utilizar para realizar sucesivos análisis, como por ejemplo en aplicaciones de reconocimiento de patrones.

La principal diferencia con los modelos normales de Markov es que los estados no serán visibles directamente, sino que lo serán las variables influidas por el estado. Cada estado tiene una distribución de probabilidad asociada sobre el conjunto de posibles valores de salida. La secuencia de valores de salida generados a partir de un HMM nos dará cierta información sobre la secuencia de estados.

Definición formal de un modelo oculto de Markov

Un modelo oculto de Markov viene definido por la tupla (Q,V,µ,A,B), dónde:

Q es el conjunto de estados Q={1,2,...,N}.
V es el conjunto {v1,v2,...,vm} de valores observables en cada estado.
EL conjunto de probabilidades iniciales µ = {µ i}.
El conjunto de probabilidades A = {aij} de transiciones entre estados.
El conjunto de probabilidades B = {bj(vk)} de las observaciones.

La secuencia de observables se denota como un conjunto O=(O1,O2,...,Ot).

Problemas asociados a los modelos ocultos de Markov

Existen tres problemas canónicos asociados a los modelos ocultos de Markov:

Dados los parámetros del modelos, ¿cuál es la posibilidad de obtener una secuencia de salida concreta? Este problema se resuelve con el algoritmo de avance-retroceso.
Dados los parámetros del modelo, ¿cuál es la secuencia de estados más probable que ha generado la secuencia observable? Este problema se resuelve con el algoritmo de Viterbi.
Dada una secuencia de salida y un conjunto de secuencias observables, ¿cuál es el HMM más probable que ha generado las secuencias? Esto se resuelve con el algoritmo de Baum-Welch.

Extraccion y Recuperacion de Informacion II

Modelos ocultos de Markov

Definición formal de un modelo oculto de Markov

Problemas asociados a los modelos ocultos de Markov

Enlaces relacionados