Recuperacion y Organizacion de la Informacion

Árboles de decisión

Los árboles de decisión tienen una serie de entradas que pueden ser un objeto o una situación descrita a través de un conjunto de atributos, a partir de los cuales se devuelve una respuesta que es una decisión tomada a partir de las entradas. Los valores de las entradas y las salidas pueden ser continuos o discretos. Por simplicidad, los más utilizados son los valores discretos.

Un árbol de decisión lleva a cabo un test a medida que este se recorre hacia las hojas para alcanzar así una decisión. El árbol de decisión suele contener nodos internos, nodos de probabilidad, nodos hojas y arcos. Un nodo interno contiene un test sobre algún valor de una de las propiedades. Un nodo de probabilidad indica que debe ocurrir un evento aleatorio de acuerdo a la naturaleza del problema, este tipo de nodos es redondo, los demás son cuadrados. Un nodo hoja representa el valor que devolverá el árbol de decisión. y finalmente la ramas brindan los posibles caminos que se tienen de acuerdo a la decisión tomada.

Un ejemplo de utilización de los árboles de decisión lo tenemos en el algoritmo ID3 .

Algoritmo ID3

Se trata de un algoritmo empleado en la búsqueda de hipótesis o reglas a partir de un conjunto de ejemplos. Dicho conjunto de ejemplos deberá estar formado por una serie de tuplas de valores (atributos) en el que uno de ellos es el objetivo. Dicho objetivo es binario (positivo o negativo, si o no, valido o invalido, etc). De esta forma el algoritmo trata de obtener las hipótesis que clasifiquen ante nuevas instancias si dicho ejemplo va a ser positivo o negativo.

Los elementos del árbol de decisión serían los siguientes:

Nodos: Los cuales contendrán atributos.
Arcos: Los cuales contienen valores posibles del nodo padre.
Hojas: Nodos que clasifican el ejemplo como positivo o negativo.

Extraccion y Recuperacion de Informacion II

Árboles de decisión

Algoritmo ID3

Enlaces relacionados