suivant: Éléments de calcul de
monter: Expériences autour du pendule
précédent: Le problème du pendule
  Table des matières
Valeur des paramètres internes choisis pour l'algorithme Q-Learning
La valeur des paramètres dans l'algorithme Q(
) est la suivante:
Pour le choix de l'action, nous utilisons une méthode ``à la
Boltzmann'', dont le facteur de température T vaut 0.01 au début
de l'apprentissage et diminue régulièrement, au début de chaque
essai.
2002-03-01