next up previous contents
suivant: Constats monter: Problématique précédent: Problématique   Table des matières

Contexte de la recherche

Une des thématiques de recherche du LSC-CEMIF est la robotique mobile. Les fonctionnalités essentielles qu'on souhaite programmer peuvent être scindées en deux problématiques: Dans le cas où l'accomplissement d'une mission nécessite plusieurs robots, une troisième problématique apparaît: la coopération entre les robots.
Des domaines applicatifs possibles sont, entre autres, l'exécution de tâches en milieu hostile, l'aide aux personnes handicapées ou la conception de robots jouets.
Suivant la précision des connaissances qu'on possède a priori sur l'environnement du robot et le comportement de ses capteurs, deux classes de possibilités s'offrent au concepteur [*]: La première approche est, du moins pour le ``puriste'', conditionnée par deux hypothèses fortes: Lorsque ces deux conditions sont remplies, le concepteur obtient la garantie que son système est fonctionnel. Cependant, en pratique, les applications de robotique mobile remplissent rarement ces deux hypothèses. On peut néanmoins enfreindre une de celles-ci, mais on perd alors la garantie de fiabilité.
C'est pour éviter une démarche de preuve astreignante et pas toujours possible que le choix d'une heuristique ou d'un algorithme d'apprentissage peut être intéressant. L'intelligence artificielle a développé intensivement deux voies de recherche, qui peuvent être applicables à la robotique mobile.
La première voie, issue du cognitivisme, consiste à former l'intelligence du robot autour de la manipulation de symboles déterminés a priori par le concepteur. La manipulation logique de symboles étant un domaine relativement bien maîtrisé, la difficulté de cette voie de recherche réside dans le choix d'un ensemble de ``bons'' symboles ainsi que dans l'obtention d'un lien fonctionnel entre les données capteurs et les symboles (problème de reconnaissance). Or, Harnad [Harnad, 1992] a montré la difficulté de cette double problématique.
La deuxième voie considère que ``l'intelligence'' du robot est une propriété émergente de réflexes perception/action, qui peuvent être appris. Brooks a été un précurseur de cette démarche [Brooks, 1986]. Dans ce cadre, plusieurs techniques d'apprentissage ont été expérimentées au LSC-CEMIF pour la navigation d'un robot mobile, basées sur les systèmes d'inférence floue et les méthodes d'apprentissage supervisé (réseaux de neurones multi-couches, réseaux neuro-flous). Ces méthodes nécessitent toutefois une connaissance partielle a priori de l'interaction entre le robot et son environnement: cela limite d'emblée les possibilités d'adaptation du robot. De ce point de vue, les techniques d'apprentissage par renforcement [Barto et al., 1983],[Watkins, 1989] offrent l'avantage de se contenter d'utiliser un retour d'information très pauvre (binaire ou ternaire, en général): le signal de retour, appelé signal de renforcement, indique à chaque instant si la tâche du robot est achevée avec succès (renforcement positif), s'il a commis une erreur (renforcement négatif) ou si l'action est neutre (renforcement nul): ces techniques introduisent un processus de conditionnement (hypothèse behavioriste initiée par Pavlov [Pavlov, 1927]). Nous nous inscrivons dans cette voie de recherche, dans laquelle un robot apprend des actions réflexes par conditionnement.
next up previous contents
suivant: Constats monter: Problématique précédent: Problématique   Table des matières
2002-03-01