next up previous contents
suivant: 6 Conclusion: deux niveaux monter: 4 Orientation de la précédent: 4 Processus de mémorisation   Table des matières

5 Intégration de la partie commande de l'entité dans le schéma perception/mémoire.

Jusqu'à présent, nous avons donné un axe de recherche faisant le lien entre perception et mémorisation, pour un signal mono-dimensionnel. Nous rappelons que le processus d'élagage possède deux fonctions. D'une part, il permet de faire face à l'incertitude concernant ce qui va se passer dans un futur proche, avec une contrepartie négative: la connaissance d'un fait (avec une quasi-certitude) ne peut avoir lieu qu'après qu'il se soit effectivement déroulé. D'autre part, ce processus permet de valider ou d'invalider un schéma d'évolution qui est extrait de la mémoire, et qui permet l'anticipation.
Comme les hypothèses 4 et 5 nous le laissent supposer, les moyens d'action de l'entité sur son environnement font partie intégrante de sa représentation mentale d'une scène et sont traités de la même manière que les moyens de perception. Cette supposition peut sembler paradoxale à première vue: l'entité ne possède pas a priori la possibilité de maîtriser les signaux perceptifs arrivant à l'instant t, alors qu'elle choisit l'action ou les actions qu'elle va exécuter au même moment. C'est pourquoi, pour une entité réactive, la question centrale est communément la suivante: ``Comment choisir l'action à exécuter à l'instant t, à partir de la donnée des signaux perceptifs reçus à t, voire t-1, t-2, ..., t-k , pour exécuter au mieux mon objectif ?''. Nous savons déjà que nous ne pouvons pas poser le problème de la même manière, car notre formalisme est centré sur la quasi-certitude que l'entité peut avoir sur son observation de l'évolution à venir ou passée d'un ensemble de signaux. À ce titre, nous allons considérer que l'entité observe également l'évolution de ses propres signaux moteurs, liés aux actions qu'elle applique à son environnement. En outre, nous tenons à signaler que, à ce stade, l'action n'est absolument pas associée à un objectif; nous ne cherchons pas non plus à comprendre l'influence d'un signal moteur sur l'évolution d'un ou plusieurs signaux perceptifs. À l'instar de son mode d'appréhension des signaux perceptifs, l'entité cherchera à anticiper l'évolution des signaux moteurs, en utilisant sa mémoire. La vérification des scenarii d'évolution des signaux moteurs se fera grâce au processus d'élagage. En particulier, cette intégration pose des contraintes sur la nature du signal moteur, qui sont identiques à celles des signaux perceptifs. L'hypothèse que nous venons de faire suggère qu'une étape obligatoire de l'apprentissage dans le complexe perception/mémoire/commande est d'associer une séquence d'informations concernant le processus de commande avec une séquence d'informations liées au processus de perception: cela est compatible avec les hypothèses 3 et 4. D'autre part, la génération d'un tuyau de section l non nulle, devant suivre un signal moteur, implique que l'entité possède certes une certaine capacité à restreindre l'univers des possibilités de l'évolution de ce signal, mais que la valeur de la commande appliquée effectivement n'est pas parfaitement précise: une infinité de valeurs pour le signal moteur peuvent être choisies en correspondance avec ce tuyau. Or, cette remarque est compatible avec l'hypothèse 7.
Cependant, le processus de perception/mémorisation ne s'occupe pas de la manière dont la valeur du signal de commande doit être choisie pour un problème donné. C'est l'intégration du signal de renforcement r qui va nous aider à accomplir cette tâche. Voici les principales lignes du mécanisme. Nous considérons l'évolution de l'ensemble des signaux (y compris les signaux moteurs) au cours du temps. Celle-ci se traduit par les activations successives de différents éléments de mémoire, formant chacun un état. Ces états, ainsi reliés entre-eux grâce à la dynamique des signaux, forment les sommets d'un graphe. L'hypothèse 7 stipule que le signal r traduit un respect de contraintes perceptives à chaque instant. Ce respect de contraintes se traduit par le fait que certains états de la mémoire ne doivent pas être atteints, à aucun moment. Nous considérerons ces états comme des états terminaux du graphe. Au cours du chapitre 4, nous verrons comment, à partir de ces noeuds terminaux, l'information négative est transmise de manière à marquer les états à partir desquels on peut aboutir à ces noeuds terminaux. Nous utiliserons en particulier une loi de cohérence entre les valeurs de marquage (binaires) des différents noeuds voisins, inspirée directement de l'algorithme minimax. Nous verrons que cette loi n'est valide que si l'entité a la possibilité d'anticiper correctement l'évolution des différents signaux, donc de reconnaître à un instant donné une situation perceptive connue.
Le marquage des états permet de sélectionner ceux à partir desquels l'entité est certaine de ne pas aboutir à un noeud terminal. Or, comme chaque état contient de l'information sur l'évolution du signal moteur sur une période de temps déterminée, le processus d'anticipation, dans le cas où il ne sélectionne que les états marqués positivement, oriente forcément le choix de la séquence d'actions à accomplir sur cette période de temps. Le choix du ou des signaux moteurs sera effectué de manière à respecter les contraintes associées aux scenarii d'évolution.


next up previous contents
suivant: 6 Conclusion: deux niveaux monter: 4 Orientation de la précédent: 4 Processus de mémorisation   Table des matières
Frédéric Davesne 2001-07-13