next up previous contents
suivant: 5 Guide de lecture monter: 4 Orientation de la précédent: 5 Intégration de la   Table des matières

6 Conclusion: deux niveaux d'apprentissage

Le schéma d'apprentissage de l'atteinte d'un objectif que nous préconisons est structuré en deux phases distinctes, régie chacune par deux signaux internes:
  1. une phase de structuration de la mémoire, basée sur la notion de quasi-certitude, permettant la mémorisation d'informations perceptives fiables, dont la nature et la précision dépendent de la nature et de la qualité des capteurs utilisés. Nous rappelons ici que ces informations sont des scenarii d'évolution des signaux perceptifs et moteurs, et que leur obtention ou leur validation s'effectue au bout d'une durée non nulle, liée à la qualité des signaux fournis.
  2. une phase d'utilisation de la mémoire, orientée par un objectif précis. L'apprentissage est semi-supervisé, guidé par un signal de renforcement binaire, dont la valeur est connue à tout moment et est supposée être parfaitement fiable.
Ces deux phases sont résumées par la figure 1.19. En outre, ce séquencement des phases d'apprentissage met en relief le pré-requis nécessaire au bon déroulement de la phase 2: la phase de maturation de la mémoire de l'entité doit lui permettre d'aborder la phase 2 en ayant des capacités d'anticipation suffisantes. Au contraire, la non-acquisition de telles capacités est, pour nous, un critère suffisant pour affirmer que l'apprentissage d'un objectif n'est pas réalisable d'une manière fiable.
La figure 1.20 met en relief la différence entre le schéma classique d'une entité réactive et notre schéma.
Nous venons de donner les bases de notre raisonnement; il s'agit à présent de le formaliser. C'est l'objet des chapitres 2 et 3, qui précisent les études menées dans le cadre de la phase d'apprentissage 1, alors que le chapitre 4 traite de la phase d'apprentissage 2.

Figure: Schéma temporel des phases d'apprentissage.
\includegraphics{fig/cap_anticip.eps}
L'échelle des temps est globale et correspond à la période de vie de l'entité. Au cours de cette période, une phase de maturation des capacités de perception (phase 1) est indispensable avant de pouvoir envisager l'apprentissage de l'atteinte d'un objectif (phase 2). Cette maturation aboutit à une capacité d'anticipation de l'évolution conjointe des signaux de perception et des signaux moteur; en cas d'échec de cette phase, un apprentissage de phase 2 peut ne pas aboutir à un résultat quasi-certain.

Figure: Notre schéma de fonctionnement de l'entité/Schéma classique d'une entité réactive.
\includegraphics{fig/class_v_anticip.eps}
Notre schéma de fonctionnement de l'entité est résumé localement (dans le temps) par la figure de gauche, alors que le schéma classique d'une entité réactive est donné par la figure de droite. Nous voyons en particulier que la remémoration d'une situation connue demande un certain délai avant d'être confirmée (partie hachurée précédant l'instant t). Il en est de même pour le processus de confirmation des scenarii (élagage entre l'instant t et l'instant t+d). D'autre part, nous ne cherchons pas à trouver un lien fonctionnel entre les signaux perceptifs et moteurs (qui sont traités de la même manière), alors que le schéma classique suppose l'existence de ce lien fonctionnel (la détermination d'une action est une fonction, déterministe ou probabiliste, des signaux perceptifs).


next up previous contents
suivant: 5 Guide de lecture monter: 4 Orientation de la précédent: 5 Intégration de la   Table des matières
Frédéric Davesne 2001-07-13