next up previous contents
suivant: Notations monter: Description de l'algorithme CbL précédent: Description de l'algorithme CbL   Table des matières

Méthodologie

Pour appliquer notre méthodologie, il faut préciser les points suivants: Dans le cas de l'AO, le système est un graphe d'états, dont nous précisons la nature exacte et les paramètres associés dans le paragraphe 2.2.2.
Les contraintes sont formées à partir d'une relation d'invariance inspiré de l'algorithme minimax [Rich, 1983], liant des états voisins (voir le paragraphe 2.2.4).
L'action de l'environnement se traduit par l'ajout de transitions dans le graphe d'états.
Enfin, la réaction du système (c'est-à-dire l'apprentissage) consiste à modifier les paramètres associés à chacun des états de manière à ce que la relation d'invariance reste valable à chaque instant.
L'ensemble action/réaction donne naissance à l'algorithme CbL (paragraphe 2.2.5).

2002-03-01