El enfoque clásico para construir un sistema experto es através de
reglas lógicas:
=1.00mm
En muchas situaciones hay incertidumbre y/o faltan datos. Un posible remedio es recurrir a una descripción probabilística. Con ese fin, considera la ocurencia de como realizaciones de variables aleatorias binarias . El caso extremo P(X2=1 | X1=1) =1, corresponde con una regla lógica. El hecho que se incorpore un componente estocástico, implica que se pierda la noción de causalidad y el problema se convierte en la formulación de una distribución sumamente multivariada sobre dónde cada Xi toma valor en . Típicamente, ri es pequeño (por ejemplo igual a 2) y n grande .
De esta manera, el problema de encontrar f() tal que f(A)=B, se convierte en la busqueda de P() tal que P(.|A) sea máximal en B. De una manera muy natural las redes bayesianas se presentan como candidatos para la familia de distribuciones P(). Así, el problema se convierte en construir una gráfica y estimar probabilidades de la forma P(Xi|Xpa(i)).
En muchas situaciones el problema sugiere una estructura ( pensamos en el ejemplo de sección 3.3.2). El otro extremo es que no se tiene ninguna información apriori. En este caso se puede plantear el problema cómo aproximar una distribucion P por medio de una P' representada por una red Bayesiana.
Para que la aproximación sea optimal, se puede exigir que
la distancia de Kullback-Leibler sea minimal, i.e. se minimiza:
En el siguiente párrafo nos restringimos a árboles.