suivant: Notations
monter: Description de l'algorithme CbL
précédent: Description de l'algorithme CbL
  Table des matières
Pour appliquer notre méthodologie, il faut préciser les points suivants:
- la nature du système étudié
- les contraintes appliquées à ce système
- l'action de l'environnement sur le système
- la réaction du système suite à l'action de l'environnement
Dans le cas de l'AO, le système est un graphe d'états,
dont nous précisons la nature exacte et les paramètres associés dans
le paragraphe 2.2.2.
Les contraintes sont formées à partir d'une relation d'invariance
inspiré de l'algorithme minimax [Rich, 1983], liant des états
voisins
(voir le paragraphe 2.2.4).
L'action de l'environnement se traduit par l'ajout de transitions dans le graphe d'états.
Enfin, la réaction du système (c'est-à-dire l'apprentissage) consiste à
modifier les paramètres associés à chacun des états de manière à ce que la
relation d'invariance reste valable à chaque instant.
L'ensemble action/réaction donne naissance à l'algorithme CbL (paragraphe 2.2.5).
2002-03-01