suivant: 5 Évolution du comportement
monter: 2 Exemple d'application: navigation
précédent: 3 Protocole d'apprentissage
  Table des matières
10 apprentissages ont été effectués pour A2. Ils ont nécessité entre 35 et 42 essais: il existe donc une faible variabilité du nombre d'essais nécessaires. La figure 4.6 résume les résultats pour un de ces 10 apprentissages. Le schéma en haut à gauche montre l'évolution du nombre de pas d'apprentissage sans échec suivant le nombre d'essais effectués. Il apparaît que le temps passé sans erreur dépend essentiellement du nombre de sommets du graphe perceptif (schéma du bas). Le nombre de sommets du graphe est lié à l'exploration de l'espace de perception de l'agent. Dans ce cas, le nombre maximal de sommets du graphe est
64 + 3×64 + 1 = 257. On s'aperçoit que ce nombre est quasiment atteint à la fin de l'apprentissage, ce qui signifie que l'exploration de l'espace de perception a été presque totale (schéma en haut à droite).
L'apprentissage de A1 a demandé entre 25 et 33 essais. Contrairement à A2 , l'espace de perception de A1 n'a pas été entièrement couvert par l'expérience puisque le graphe perceptif contient en moyenne environ 200 sommets.
Lorsque les 4 agents ont subi un apprentissage, on les utilise au sein de l'algorithme d'atteinte d'objectif . Le résultat visuel du comportement du robot est donné par la figure 4.5.
Figure:
Comportement de recherche d'objectif avec évitement d'obstacles de Khepera.
|
Figure:
Résultats d'apprentissage concernant l'agent A2.
|
suivant: 5 Évolution du comportement
monter: 2 Exemple d'application: navigation
précédent: 3 Protocole d'apprentissage
  Table des matières
Frédéric Davesne
2001-07-13