next up previous contents
suivant: Éléments de calcul de monter: Expériences autour du pendule précédent: Le problème du pendule   Table des matières


Valeur des paramètres internes choisis pour l'algorithme Q-Learning

La valeur des paramètres dans l'algorithme Q($ \lambda$) est la suivante: Pour le choix de l'action, nous utilisons une méthode ``à la Boltzmann'', dont le facteur de température T vaut 0.01 au début de l'apprentissage et diminue régulièrement, au début de chaque essai.

2002-03-01