next up previous contents
suivant: 5 Évolution du comportement monter: 2 Exemple d'application: navigation précédent: 3 Protocole d'apprentissage   Table des matières

4 Durée d'un apprentissage - Relation avec le nombre de sommets parcourus du graphe perceptif.

10 apprentissages ont été effectués pour A2. Ils ont nécessité entre 35 et 42 essais: il existe donc une faible variabilité du nombre d'essais nécessaires. La figure 4.6 résume les résultats pour un de ces 10 apprentissages. Le schéma en haut à gauche montre l'évolution du nombre de pas d'apprentissage sans échec suivant le nombre d'essais effectués. Il apparaît que le temps passé sans erreur dépend essentiellement du nombre de sommets du graphe perceptif (schéma du bas). Le nombre de sommets du graphe est lié à l'exploration de l'espace de perception de l'agent. Dans ce cas, le nombre maximal de sommets du graphe est 64 + 3×64 + 1 = 257. On s'aperçoit que ce nombre est quasiment atteint à la fin de l'apprentissage, ce qui signifie que l'exploration de l'espace de perception a été presque totale (schéma en haut à droite).
L'apprentissage de A1 a demandé entre 25 et 33 essais. Contrairement à A2 , l'espace de perception de A1 n'a pas été entièrement couvert par l'expérience puisque le graphe perceptif contient en moyenne environ 200 sommets.
Lorsque les 4 agents ont subi un apprentissage, on les utilise au sein de l'algorithme d'atteinte d'objectif . Le résultat visuel du comportement du robot est donné par la figure 4.5.

Figure: Comportement de recherche d'objectif avec évitement d'obstacles de Khepera.
\includegraphics{fig/fusion2.eps}

Figure: Résultats d'apprentissage concernant l'agent A2.
\includegraphics{fig/res1.eps}


next up previous contents
suivant: 5 Évolution du comportement monter: 2 Exemple d'application: navigation précédent: 3 Protocole d'apprentissage   Table des matières
Frédéric Davesne 2001-07-13