suivant: Positionnement de l'AR par
monter: Cadre général de l'apprentissage
précédent: Le mécanisme d'AR schématisé
  Table des matières
Nous ne souhaitons pas aborder l'étendue de la problématique posée
par l'AR, qui est un domaine de recherche vaste, en constante
évolution. Pour une information générale sur ce domaine, le
lecteur pourra consulter avec profit les références suivantes:
- pour une première approche, on pourra lire l'état de l'art
établi par Kaebling [Kaebling et al., 1996]
- le livre écrit par Sutton est une introduction très complète
[Sutton et Barto, 1998]. La thèse de Wiering est également très riche
[Wiering, 1999]
- pour une formalisation plus poussée et le détail des preuves
de convergence de l'AR dans le cas discret, on pourra consulter
[Bersekas et Tsitsiklis, 1996], alors que la thèse de [Munos, 1997]
fournit des preuves de convergence dans le cas continu.
2002-03-01