Supongamos que tenemos la información I que para cada v, (Sv puede ser de un singletón hasta el universum para esta variable). Denotamos con I-v resp. I+v la información de I relacionada con nodos (variables) k y sus descendientes resp. no descendientes de v.
Usando la regla de Bayes y Propiedad , sabemos que para cualquier nodo v
Demostramos primero como calcular
P(I-v |Xv ) por medio de una sola corrida a través del árbol desde las hojas hacia la raíz. Por supuesto, si v es una hoja
.
En general:
En consequencia, podemos expresar P(I-v |Xv=xv ) en términos de P(I-w |Xw=xw ) asociados con sus hijos.
Se puede derivar algo similar para el segundo término
P(Xv=xv |I+v) en () (pero ahorita desde la raíz hacia las hojas):
y
Lo último se puede calcular por medio de ().