Los modelos ocultos de Markov fueron desarrollados por A. Markov en 1913 para modelizar secuencias de palabras en ruso y en la actualidad se usan como herramienta estadística de propósito general. Se formaliza la etiquetación como un proceso doblemente aleatorio parametrizable (los parámetros se pueden estimar de forma precisa en el entrenamiento) en el que el modelo del lenguaje es representado por un autómata finito probabilista.
El objetivo de un modelo oculto de Markov es determinar los parámetros desconocidos en un proceso de Markov de parámetros desconocidos a partir de ciertos parámetros observables. Los parámetros obtenidos se pueden utilizar para realizar sucesivos análisis, como por ejemplo en aplicaciones de reconocimiento de patrones.
La principal diferencia con los modelos normales de Markov es que los estados no serán visibles directamente, sino que lo serán las variables influidas por el estado. Cada estado tiene una distribución de probabilidad asociada sobre el conjunto de posibles valores de salida. La secuencia de valores de salida generados a partir de un HMM nos dará cierta información sobre la secuencia de estados.
Un modelo oculto de Markov viene definido por la tupla (Q,V,µ,A,B), dónde:
La secuencia de observables se denota como un conjunto O=(O1,O2,...,Ot).
Existen tres problemas canónicos asociados a los modelos ocultos de Markov:
Página creada por David Miguel Campos Ramírez
Última Actualización: 28-03-2008
Wiki Grupo 15 - Recuperación y Organización de la información - Extracción y Recuperación de Información II