Méthodologie

suivant: Notations monter: Description de l'algorithme CbL précédent: Description de l'algorithme CbL Table des matières

Méthodologie

Pour appliquer notre méthodologie, il faut préciser les points suivants:

la nature du système étudié
les contraintes appliquées à ce système
l'action de l'environnement sur le système
la réaction du système suite à l'action de l'environnement

Dans le cas de l'AO, le système est un graphe d'états, dont nous précisons la nature exacte et les paramètres associés dans le paragraphe 2.2.2.
Les contraintes sont formées à partir d'une relation d'invariance inspiré de l'algorithme minimax [Rich, 1983], liant des états voisins (voir le paragraphe 2.2.4).
L'action de l'environnement se traduit par l'ajout de transitions dans le graphe d'états.
Enfin, la réaction du système (c'est-à-dire l'apprentissage) consiste à modifier les paramètres associés à chacun des états de manière à ce que la relation d'invariance reste valable à chaque instant.
L'ensemble action/réaction donne naissance à l'algorithme CbL (paragraphe 2.2.5).

2002-03-01