Proposition _s
Pour un ensemble d'états donné, il
existe un ensemble d'associations état/commande formant une
politique de commande fiable (en terme d'objectif ou de viabilité)
si et seulement si l'algorithme d'apprentissage CbL découvre une
politique de commande fiable. Ce résultat est valable dans la
mesure où les contraintes associées à la proposition
1 sont satisfaites.