Localisation référencée modèle d'un robot mobile d'intérieur par vision monoculaire

Présentée par

Omar AIT AIDER

Soutenue le 19 décembre 2002 devant le jury suivant

Mustapha MOUADDIB

CREA

Rapporteur

Marie Josée ALDON

LIRMM

Rapporteur

Jacques DROULEZ

LPPA

Examinateur, président du jury

Malik MALLEM

LSC

Examinateur

Etienne COLLE

LSC

Directeur de thèse

Philippe HOPPENOT

LSC

Encadreur

La robotique d'assistance aux personnes handicapées s'est développée ces dernières années. Elle cherche à restaurer, au moins partiellement, l'autonomie d'une personne handicapée dans sa vie de tous les jours, au travail… Ce domaine d'application impose deux contraintes : le coût qui doit rester modéré et la fiabilité. Dans le cadre du projet ARPH (Assistance Robotique aux Personnes Handicapées) développé au CEMIF-LSC, notre démarche consiste dans un premier temps à étudier la capacité d'autonomie du robot pour pouvoir ensuite proposer à la personne des modes de commande partagés dans lesquels l'opérateur humain et la machine pilotent ensemble le robot pour atteindre l'objectif souhaité par la personne.
ARPH est une base mobile équipée d'un bras manipulateur afin de pouvoir saisir des objets. La première étape est de déplacer la base mobile vers l'objet à saisir. Elle met en œuvre des notions de planification de trajectoire et de navigation, basées sur une connaissance de la position du robot. Dans un environnement intérieur, cette dernière doit être connue avec une précision de quelques dizaines de centimètres en translation et de quelques degrés en rotation. Une caméra permet d'obtenir en une seule acquisition suffisamment d'informations. Les primitives utilisées sont ici des segments, nombreux dans un environnement structuré et facile à extraire par des traitements classiques en image. Les deux points clé de cette démarche restent d'une part la mise en correspondance des segments mesurés et ceux définis par le modèle partiel de l'environnement et d'autre part le calcul de la position à partir de l'appariement choisi. L'utilisation d'une seule caméra est imposée par les contraintes de coût financier et de temps de calcul. Toute la chaîne de développement, de la capture de l'image au calcul de la position, a été développée et permet d'obtenir un système complet. Les apports scientifiques portent sur les deux derniers points à savoir la mise en correspondance et le calcul de la position.
En supposant la mise ne correspondance résolue, le calcul de la position du robot s'appuie principalement sur deux méthodes : Phong-Horaud et Lowe. Ces deux méthodes ont été adaptées au contexte de la robotique mobile. En effet, elles sont énoncées dans le cas général où la position est donnée par trois composantes en translation et trois composantes en rotation. Dans notre cas, le sol étant plat, seules deux composantes en translation sont utiles. Les angles de roulis et de tangage peuvent aussi être considérés connus ce qui limite la rotation à un seul angle. Une formulation dans ce cas fait apparaître des simplifications qui rendent ces méthodes plus simples, donc plus rapides, et utilisables à partir de seulement deux segments.
La mise en correspondance entre les segments mesurés et modélisés est basée sur la recherche arborescente. La difficulté majeure de cette approche est l'explosion combinatoire. Dans un premier temps, l'utilisation d'une connaissance a priori de la position du robot grâce à l'odométrie permet de réduire le nombre de segments visibles du modèle en utilisant les régions d'invariance visuelle. Deux contraintes géométriques sont ensuite appliquées. La première, unaire, donne des appariements possibles entre un segment mesuré et un segment du modèle. Elle ne s'applique qu'à des segments non verticaux du modèle. La seconde, binaire, donne des appariements possibles entre une paire de segments mesurés et une paire de segments du modèle. Elle s'applique à des segments verticaux du modèle. Après l'application de ces contraintes, le nombre d'hypothèses restantes est suffisamment faible pour estimer une position pour tous les cas dans un temps raisonnable et choisir la meilleure grâce à une fonction de coût.
Les méthodes proposées sont d'abord testées sur des données synthétiques bruitées avant de prouver leur efficacité sur des images réelles. Les résultats de localisation font apparaître des erreurs en translation de l'ordre de vingt centimètres et deux degrés. L'étude de la sensibilité à la qualité de l'initialisation et au nombre de segments donne les limites d'utilisation de ces méthodes. Elles restent suffisantes pour notre application.
L'élagage de l'arbre des possibilités de mise en correspondance est aussi testé avec des données synthétiques et des images réelles. Le nombre moyen d'hypothèses retenues est de l'ordre de la centaine. Il est très peu sensible à la qualité de l'initalisation. De plus, le bon appariement est toujours présent dans la liste de ceux retenus et la fonction de coût associée à l'algorithme de localisation utilisé le désigne comme le meilleur avec une grande marge de sécurité.