Proposition _s
lorsque le système respecte
(

), le marquage

d'un état

vaut 1
dans l'unique cas où il existe au moins une politique de commande
empruntant

parvenant à coup sûr à l'objectif

.
Proposition _s
lorsque le problème de choix de commande
est markovien, le marquage

d'un état

vaut -1 dans
le cas où aucune politique de commande empruntant

ne peut
éviter

.
Proposition _s
Pour un problème de viabilité, si on
constate à un moment de l'apprentissage qu'il existe des états
formant un cycle ou plusieurs cycles, dont les marquages possèdent
une qualité 0, cela signifie que la politique de commande associée
au parcours de ce ou ces cycles n'a jamais échoué jusqu'à ce
moment précis.