suivant: Description de l'algorithme CbL
monter: Introduction
précédent: Genèse de l'algorithme CbL
  Table des matières
Ce chapitre est consacré à la construction d'un algorithme, appelé
CbL, qui respecte la méthodologie que nous nous sommes imposée. La
section 2.2 décrit le système et les
contraintes appliquées à celui-ci. Il décrit l'algorithme CbL
(voir l'algorithme 2.1 à la page
). L'étude théorique est détaillée dans la
section 2.3. Nous prouvons que l'ensemble de nos
exigences est respecté, lorsque la propriété (
) est
satisfaite (atteinte d'objectif) ou lorsque le problème de choix
de commande est markovien (respect d'une zone de viabilité). Les
propriétés d'incrémentalité de CbL sont discutées dans la section
2.4. Les deux sections suivantes étudient des
applications de l'algorithme CbL. Le problème du labyrinthe, dont
on sait qu'il respecte la propriété (
), sert
d'exemple applicatif d'atteinte d'objectif (section
2.5). Nous étudions également un problème de
navigation d'un robot miniature Khepera simulé (section
2.6): l'apprentissage d'un comportement de suivi
de mur est un exemple simple de respect d'une zone de viabilité.
Dans ces exemples, nous comparons les performances de l'algorithme
CbL avec celles du Q-Learning. Le lecteur pourra consulter les
travaux faisant référence à ce chapitre: [Davesne et Barret, 1999b],
[Davesne et Barret, 1999a], pour une description de l'algorithme d'AO,
ainsi que pour son application dans une tâche de navigation d'un
robot mobile Khepera simulé.
suivant: Description de l'algorithme CbL
monter: Introduction
précédent: Genèse de l'algorithme CbL
  Table des matières
2002-03-01