Guide de ce chapitre

suivant: Description de l'algorithme CbL monter: Introduction précédent: Genèse de l'algorithme CbL Table des matières

Guide de ce chapitre

Ce chapitre est consacré à la construction d'un algorithme, appelé CbL, qui respecte la méthodologie que nous nous sommes imposée. La section 2.2 décrit le système et les contraintes appliquées à celui-ci. Il décrit l'algorithme CbL (voir l'algorithme 2.1 à la page

). L'étude théorique est détaillée dans la section 2.3. Nous prouvons que l'ensemble de nos exigences est respecté, lorsque la propriété ( $P_{\epsilon }$ ) est satisfaite (atteinte d'objectif) ou lorsque le problème de choix de commande est markovien (respect d'une zone de viabilité). Les propriétés d'incrémentalité de CbL sont discutées dans la section 2.4. Les deux sections suivantes étudient des applications de l'algorithme CbL. Le problème du labyrinthe, dont on sait qu'il respecte la propriété ( $P_{\epsilon }$ ), sert d'exemple applicatif d'atteinte d'objectif (section 2.5). Nous étudions également un problème de navigation d'un robot miniature Khepera simulé (section 2.6): l'apprentissage d'un comportement de suivi de mur est un exemple simple de respect d'une zone de viabilité. Dans ces exemples, nous comparons les performances de l'algorithme CbL avec celles du Q-Learning. Le lecteur pourra consulter les travaux faisant référence à ce chapitre: [Davesne et Barret, 1999b], [Davesne et Barret, 1999a], pour une description de l'algorithme d'AO, ainsi que pour son application dans une tâche de navigation d'un robot mobile Khepera simulé.

suivant: Description de l'algorithme CbL monter: Introduction précédent: Genèse de l'algorithme CbL Table des matières

2002-03-01