Protocole expérimental

suivant: Résultats monter: Problème de navigation d'un précédent: Préparation du contexte d'apprentissage Table des matières

Protocole expérimental

Notre objectif est d'étudier l'apprentissage du comportement d'évitement par suivi de mur. Le problème d'atteinte d'objectif est ensuite réglé en utilisant l'algorithme de navigation 2.4, une fois que l'apprentissage est terminé.
L'algorithme CbL(1) sera utilisé pour ce problème de viabilité. L'ensemble des marquages possibles est réduit à {0,-1}.
Nous effectuons 100 apprentissages. Chacun de ceux-ci comporte 1000 essais. Chaque essai comporte 500.000 itérations. Un essai est considéré comme réussi si le robot a respecté ses contraintes de viabilité pendant 500.000 itération consécutives.
On effectue en premier l'apprentissage des agents de plus bas niveau, c'est-à-dire $T_{2}$ et $T_{2}^{'}$ . Pour cela, au début de chaque essai, on initialise la position du robot d'une manière aléatoire dans l'espace libre de l'environnement. Les deux apprentissages sont effectués indépendamment. Dans un deuxième temps, on effectue l'apprentissage de $T_{1}$ et de $T_{1}^{'}$ en utilisant les agents $T_{2}$ et $T_{2}^{'}$ ayant appris. Pour ces deux apprentissages, on initialise le robot près d'un mur, de manière à ce que les conditions initiales soient favorables (restent dans la zone de viabilité du problème de suivi de mur).

suivant: Résultats monter: Problème de navigation d'un précédent: Préparation du contexte d'apprentissage Table des matières

2002-03-01