suivant: Constats
monter: Problématique
précédent: Problématique
  Table des matières
Une des thématiques de recherche du LSC-CEMIF est la robotique
mobile. Les fonctionnalités essentielles qu'on souhaite programmer
peuvent être scindées en deux problématiques:
- se déplacer d'un endroit à un autre d'un environnement
- saisir un objet
Dans le cas où l'accomplissement d'une mission nécessite plusieurs robots,
une troisième problématique apparaît: la coopération entre les robots.
Des domaines applicatifs possibles sont, entre autres, l'exécution de
tâches en milieu hostile, l'aide aux personnes handicapées ou la conception
de robots jouets.
Suivant la précision des connaissances qu'on possède a
priori sur l'environnement du robot et le comportement de ses
capteurs, deux classes de possibilités s'offrent au concepteur
:
- utiliser des méthodes inspirées de l'automatique
- employer des heuristiques ou des algorithmes d'apprentissage
La première approche est, du moins pour le ``puriste'',
conditionnée par deux hypothèses fortes:
- modéliser le robot, son environnement et leur interaction, avec une
précision suffisante
- pouvoir montrer la stabilité de la loi de commande du robot associée
à ce modèle
Lorsque ces deux conditions sont remplies, le concepteur obtient la garantie
que son système est fonctionnel. Cependant, en pratique, les applications de
robotique mobile remplissent rarement ces deux hypothèses. On peut néanmoins
enfreindre une de celles-ci, mais on perd alors la garantie de fiabilité.
C'est pour éviter une démarche de preuve astreignante et pas toujours possible
que le choix d'une heuristique ou d'un algorithme d'apprentissage peut être
intéressant. L'intelligence artificielle a développé intensivement deux voies
de recherche, qui peuvent être applicables à la robotique mobile.
La première voie, issue du cognitivisme, consiste à former l'intelligence du
robot autour de la manipulation de symboles déterminés a priori par le
concepteur. La manipulation logique de symboles étant un domaine relativement
bien maîtrisé, la difficulté de cette voie de recherche réside dans le choix
d'un ensemble de ``bons'' symboles ainsi que dans l'obtention d'un lien fonctionnel
entre les données capteurs et les symboles (problème de reconnaissance).
Or, Harnad [Harnad, 1992] a montré la difficulté de cette double problématique.
La deuxième voie considère que ``l'intelligence'' du robot est une
propriété émergente de réflexes perception/action, qui peuvent
être appris. Brooks a été un précurseur de cette démarche
[Brooks, 1986]. Dans ce cadre, plusieurs techniques
d'apprentissage ont été expérimentées au LSC-CEMIF pour la
navigation d'un robot mobile, basées sur les systèmes d'inférence
floue et les méthodes d'apprentissage supervisé (réseaux de
neurones multi-couches, réseaux neuro-flous). Ces méthodes
nécessitent toutefois une connaissance partielle a priori de
l'interaction entre le robot et son environnement: cela limite
d'emblée les possibilités d'adaptation du robot. De ce point de
vue, les techniques d'apprentissage par renforcement
[Barto et al., 1983],[Watkins, 1989] offrent l'avantage de se
contenter d'utiliser un retour d'information très pauvre (binaire
ou ternaire, en général): le signal de retour, appelé signal
de renforcement, indique à chaque instant si la tâche du robot
est achevée avec succès (renforcement positif), s'il a commis une
erreur (renforcement négatif) ou si l'action est neutre
(renforcement nul): ces techniques introduisent un processus de
conditionnement (hypothèse behavioriste initiée par Pavlov
[Pavlov, 1927]). Nous nous inscrivons dans cette voie de
recherche, dans laquelle un robot apprend des actions réflexes par
conditionnement.
suivant: Constats
monter: Problématique
précédent: Problématique
  Table des matières
2002-03-01