suivant:
Introduction
monter:
Apprentissage d'objectif (AO)
précédent:
Apprentissage d'objectif (AO)
 
Table des matières
Influence du contexte sur l'apprentissage par renforcement
Sous-sections
Introduction
Idées directrices
Guide du chapitre
Cadre général de l'apprentissage par renforcement (AR)
Le mécanisme d'AR schématisé - les termes clés
Références générales
Positionnement de l'AR par rapport à d'autres méthodes d'apprentissage
Problématique et méthodes de résolution liées à l'AR
Conditions de convergence des algorithmes d'AR
Causes de difficultés dans l'utilisation des algorithmes d'AR
Lien entre incertitude, imprécision, fiabilité et prédictibilité
Outils d'étude de l'incertitude due au contexte de l'AR
Introduction
Qu'entendons-nous par ``qualité'' du contexte d'apprentissage ?
Notations
Contexte idéal et quasi-idéal - Propriété (
)
Exemples de contextes vérifiant ou ne vérifiant pas (
)
Information associée à l'exécution d'une action
Mesures utilisant l'entropie de Shannon
Protocole de calcul des mesures
et
Modélisation du flux d'erreurs dû au contexte d'apprentissage
Modélisation d'un flux d'erreurs mono-causal
Modélisation d'un flux d'erreurs bi-causal dépendant de l'état initial du système
Expérimentations autour du problème du pendule inversé
Objectif
Analyse préliminaire des résultats antérieures sur l'influence du bruit de mesure sur l'apprentissage par AR
Protocole expérimental
Analyse des mesures
et
lorsque la qualité des données d'entrée est dégradée
Découverte des sources d'erreur du contexte de l'apprentissage
Relation entre
et
Conclusion
2002-03-01