suivant: Notations
monter: Outils d'étude de l'incertitude
précédent: Introduction
  Table des matières
Un algorithme d'AR utilise des données provenant d'un contexte sur
lequel il ne peut pas agir. Ce contexte est formé principalement
des éléments suivants:
- la topologie des états du système
- la dynamique du système
- la nature et la qualité des données d'entrée
- les actions du système lui permettant de changer d'état
- les paramètres internes à l'algorithme, que celui-ci ne peut pas
modifier au cours de son exécution
Nous pensons que l'adéquation entre la topologie des états du système, la
dynamique du système, la nature et la qualité des données d'entrée et les
actions du système est nécessaire à l'obtention d'un bon résultat
d'apprentissage. Nous proposons un moyen de quantifier cette adéquation,
utilisant l'entropie associée aux résultats possibles de l'exécution
d'une action, c'est-à-dire aux différents états auxquels le système peut
parvenir après avoir exécuté une action, connaissant l'état au moment de
l'exécution de celle-ci. En cela, nous regardons l'action comme une faculté
discriminante de la perception (état du système). Cette idée est une hypothèse
développée dans le cadre du vivant: nous en reparlerons dans la troisième partie
de ce document de thèse.
La ``qualité'' du contexte d'apprentissage est représentée par la
mesure de l'adéquation présentée ci-dessus. L'objet de cette
section est de spécifier cette mesure, qui est utilisée
classiquement en théorie de l'information et en théorie de la
décision.
suivant: Notations
monter: Outils d'étude de l'incertitude
précédent: Introduction
  Table des matières
2002-03-01