suivant: Résultats
monter: Problème de navigation d'un
précédent: Préparation du contexte d'apprentissage
  Table des matières
Notre objectif est d'étudier l'apprentissage du comportement
d'évitement par suivi de mur. Le problème d'atteinte d'objectif
est ensuite réglé en utilisant l'algorithme de navigation
2.4, une fois que l'apprentissage est terminé.
L'algorithme CbL(1) sera utilisé pour ce problème de viabilité.
L'ensemble des marquages possibles est réduit à {0,-1}.
Nous effectuons 100 apprentissages. Chacun de ceux-ci comporte 1000 essais.
Chaque essai comporte 500.000 itérations. Un essai est considéré comme
réussi si le robot a respecté ses contraintes de viabilité pendant 500.000
itération consécutives.
On effectue en premier l'apprentissage des agents de plus bas
niveau, c'est-à-dire
et
. Pour cela, au début
de chaque essai, on initialise la position du robot d'une manière
aléatoire dans l'espace libre de l'environnement. Les deux
apprentissages sont effectués indépendamment. Dans un deuxième
temps, on effectue l'apprentissage de
et de
en
utilisant les agents
et
ayant appris. Pour ces
deux apprentissages, on initialise le robot près d'un mur, de
manière à ce que les conditions initiales soient favorables
(restent dans la zone de viabilité du problème de suivi de mur).
suivant: Résultats
monter: Problème de navigation d'un
précédent: Préparation du contexte d'apprentissage
  Table des matières
2002-03-01