Rapport d'activité LSC: 2.2.2. Modélisation et reconstruction d'environnements 3D

[Retour au sommaire] [suivant] [précédent]

2.2.2. Modélisation et reconstruction d'environnements 3D

La reconnaissance d'objets 3D nécessite la modélisation 3D de ceux-ci pour les incorporer dans une base de données 3D, la reconstruction 3D afin de calculer leur nouvelle situation en cas de mouvement de ceux-ci et l'appariement 2D/3D afin de réaliser une reconnaissance automatique. Nous présentons les méthodes que nous avons développées pour modéliser, reconstruire et apparier les objets 3D avec leur image 2D.

2.2.2.1 - Modélisation 3D

Dans cette partie, des méthodes de modélisation de volumes englobants d'objets polyédriques et cylindriques, présentant une symétrie, sont présentées en utilisant une caméra et un télémètre monté sur un dispositif rotatif à deux degrés de liberté. Cette modélisation est utilisée pour enrichir la base de données 3D de l'environnement afin de permettre la réalisation de tâches robotiques. Elle n'est en aucun cas destinée à modéliser fidèlement des objets de formes complexes. Cette modélisation est réalisée interactivement avec la coopération de l'utilisateur qui indique la classe d'objet à modéliser et télécommande les capteurs afin de réaliser le relevé 3D, nécessaire au calcul des dimensions et l'attitude spatiale de l'objet.

Trois classes d'objets sont considérées : celle des prismes symétriques, celle des cylindres et celle des objets à symétrie de révolution n'appartenant pas aux deux catégories précédentes et à génératrice non forcément rectiligne.

L'idée originale pour toutes ces méthodes consiste à utiliser le capteur mixte constitué par la caméra et le télémètre. L'image caméra sert à positionner l'objet dans une pyramide infinie ayant pour sommet le centre optique de la caméra. Le télémètre fournit l'information de profondeur qui permet de situer l'objet dans la pyramide.

a - Modélisation de prisme symétrique [NZI96R]

Pour un prisme symétrique, le relevé 3D de deux faces suffit pour le modéliser. Nous utilisons une face extrême dite principale et une des faces latérales dite secondaire. Les faces choisies sont celles pour lesquelles les mesures télémètriques sont les meilleures et qui sont vues simultanément par la caméra et par le télémètre.

L'image caméra et le modèle géométrique inverse de celle-ci permettent de déterminer les plans tangents (plans d'interprétation) aux contours de chacune des deux faces (un plan d'interprétation est un plan qui passe par une arête de l'objet et le centre optique de la caméra). Ces plans permettent de définir une pyramide infinie ayant pour sommet le centre optique de la caméra. Le télémètre permet de déterminer l'équation du plan porteur de la face. L'intersection entre la pyramide et le plan porteur de la face permet de définir le contour de celle-ci.

Le volume englobant est ensuite généré en translatant la face principale selon un vecteur ayant une extrémité commune avec la face secondaire.

b - Modélisation de cylindre

Le résultat de la modélisation est la position de l'axe de la primitive cylindrique, sa hauteur et ses rayons.

La définition des différents plans d'interprétation est illustrée sur la figure II.10. La caméra permet de définir l'équation des quatre plans d'interprétation Pci (i=1..4), relatifs aux génératrices du cylindre et à ses bases.

En tenant compte de l'attitude du cylindre (vertical, horizontal ou incliné), nous effectuons avec le DR3D, deux balayages à deux niveaux différents. A l'aide des points, obtenus après balayage, on détermine l'équation d'un plan frontal Ptl3 tangent au cylindre. Compte tenu du diamètre du faisceau laser, le profil du cylindre relevé ne correspond pas au profil exact (effet d'empreinte). Cependant, on peut détecter les extrêmes. Chaque balayage permet d'obtenir les coordonnées des points latéraux et de déterminer les plans Ptl1 et Ptl2 .

Ces informations sont redondantes, une méthode d'optimisation permet d'en faire la fusion pour accéder aux paramètres de la primitive géométrique [TRI96R].

c - Modélisation d'objets à symétrie de révolution

La modélisation d'objets à symétrie de révolution est basée sur l'utilisation des courbes BSpline. Elle est applicable à des objets d'axe droit ou courbe contenu dans un plan. Le principe de modélisation consiste à représenter une limbe (contour de l'objet) et l'axe de l'objet par des courbes B-spline et à effectuer un balayage rotoïde de la limbe autour de l'axe afin de générer un volume englobant le corps de révolution.

Cette méthode est valable pour représenter des objets de faibles rayons de courbure. Elle offre l'avantage de ne nécessiter aucun appariement. En revanche, l'acquisition des points caractéristiques de l'axe de rotation est contraignant. Cette approche de modélisation des corps de révolution est une première ébauche d'un travail qui doit se poursuivre afin de permettre une modélisation plus précise et plus rapide.

2.2.2.2- Reconstruction 3D

La reconstruction 3D consiste à réactualiser la base de données 3D de l'environnement en se basant uniquement sur les indices 2D fournis par l'image caméra. L'approche utilisée consiste à déterminer la transformation rigide (rotation et translation) subie par l'objet dont la géométrie est a priori connue.

La méthode utilisée se déroule en deux étapes. Dans la première étape, on utilise une méthode géométrique valable quel que soit l'angle de rotation, basée sur la connaissance de trois arêtes L1, L2, L3 du modèle d'un objet, défini dans un système d'axes (Rm) lié au modèle, et de trois segments l1, l2, l3 détectés dans une image et définis dans le système d'axes (Rc) lié à la caméra. L'objectif est de déterminer la rotation R et la translation T à appliquer à Li (i=1..3) afin que leurs images coïncident avec celles des li. Nous avons adapté la méthode développée par M. Dhome (LASMEA) en proposant un formalisme plus direct.

L'objectif de la seconde étape est d'affiner le recalage à grande amplitude à l'aide d'une méthode de reconstruction appliquée aux petites rotations. Dans ce cas, il est possible de linéariser le système à résoudre, ceci présente le grand avantage de pouvoir utiliser des informations redondantes et ainsi de délivrer un résultat plus précis. Les paramètres trouvés par cette méthode sont les coordonnées du vecteur translation et du vecteur rotation instantanée [NZI95T], [NZI97R].

Une autre approche a été testée. Elle est basée sur la connaissance des distances entre certains sommets de l'objet à reconstruire. L'idée est de positionner directement dans l'espace 3D les points qui définissent les sommets de l'objet à reconstruire. Ces points sont situés sur une droite connue (le rayon optique associé à ce point) et le principe de la méthode consiste à définir la distance entre le point recherché et un point arbitraire du rayon optique qui peut être le centre optique. Les paramètres de la rotation et de la translation sont déterminés alors par un algorithme d'optimisation non linéaire [MOR97C].

2.2.2.3- Appariement 2D/3D

Pour appliquer les méthodes de recalage décrites précédemment, il est nécessaire d'apparier les indices 2D extraits de l'image comportant l'objet avec les primitives correspondantes de son modèle 3D.

Les méthodes d'appariement étudiées au laboratoire sont applicables aux objets polyédriques.

La transformée de Hough est appliquée pour la segmentation de l'image. L'élaboration du modèle 2D est basée sur l'organisation perceptive des indices 2D extraits de l'image.

Le modèle 3D est de type B-Rep (" Boundary Representation "), un graphe d'aspects, valable pour des objets polyédriques convexes et concaves, qui décrit la topologie du modèle 3D est créé automatiquement, il est représenté par l'ensemble des vues d'un objet. Nous nous limitons aux aspects dits topologiquement différents, c'est-à-dire des aspects dont les éléments géométriques visibles sont différents .

Dans la méthode du graphe d'appariement, un graphe de compatibilité entre le modèle 2D et le graphe d'aspects est élaboré. Les arcs du graphe de compatibilité représentent les hypothèses d'appariement entre une chaîne de segments 2D et une face d'un aspect du modèle 3D. Ensuite, la transformation précise entre le modèle 3D et le repère de l'environnement est calculée dans la phase de vérification durant laquelle on applique les invariants géométriques, basés sur des rapports de surfaces de l'objet dans le modèle 3D et dans l'image 2D, pour éliminer les hypothèses invalides (figure II.11). Ceci constitue l'originalité forte apportée par le laboratoire dans cette méthode [CHA97C].

Cette méthode est tributaire de la qualité de l'image caméra. Si celle-ci est dégradée, le résultat du traitement de l'image s'avère insuffisant - difficulté d'extraction des chaînes de segments - pour appliquer la méthode du graphe d'appariement. Ce problème est traité en utilisant une méthode de hachage géométrique basée sur les sommets des objets [SHA99T].

Toutes les méthodes décrites sont validées en utilisant le banc d'expérimentation représenté sur la figureII.12.