next up previous contents
suivant: Problème du labyrinthe monter: Propriété d'incrémentalité de l'algorithme précédent: Découverte de l'ajout d'un   Table des matières

Conclusion: lien entre la capacité d'incrémentalité de l'algorithme CbL et l'invariant structurel engendré par ( $ P_{\epsilon }$)

Pour obtenir le caractère d'incrémentalité de l'algorithme CbL($ \alpha $), il nous faut supposer que le contexte de l'apprentissage respecte la propriété ( $ P_{\epsilon }$). En effet, nous nous basons sur ce postulat pour discerner une modification de l'environnement (cas où une deuxième transition doit être créée à partir d'un état $ e_{i,k}$).
La propriété ( $ P_{\epsilon }$) peut être vue comme un invariant structurel du graphe, à l'instar de la contrainte d'équilibre reliant les marquages d'états voisins. Si on considère que cette propriété doit être respectée à chaque pas de temps, la tentative de création d'une deuxième transition à partir d'un état $ e_{i,k}$ invalide cet invariant. Pour le rétablir, il suffit de supprimer l'ancienne transition. La modification de l'environnement est alors perçue par le système comme une double opération d'ajout et de suppression de transitions à partir d'un même état $ e_{i,k}$. L'observation de ce changement à travers le graphe d'états est alors une propriété émergente de l'invariant structurel sous-jacent à la propriété ( $ P_{\epsilon }$).
Ce changement mineur de l'algorithme CbL est effectuée simplement, en modifiant légèrement l'algorithme 2.2, page [*]: au niveau de la création d'une transition, il suffit de regarder si une autre transition partant de $ e_{i,k}$ existe déjà et la supprimer le cas échéant. Dans le cas d'une suppression, il faut appeler l'algorithme 2.1, page [*], pour une mise en cohérence des marquages. La politique de commande est alors modifiée naturellement par l'ajout ou la suppression d'une cible (c'est-à-dire par la découverte d'une nouvelle transition vers $ E_{S}$), ainsi que par l'ajout d'une source d'erreurs (c'est-à-dire par la découverte d'une nouvelle transition vers $ E_{E}$). La prise en compte de la suppression d'une source d'erreurs n'est intéressante que dans le cas où le système est confiné dans un ensemble restreint d'états viables sans pouvoir atteindre l'objectif. Dans ce cas, il est nécessaire d'ajouter une stratégie de haut niveau, commandant régulièrement la suppression des transitions vers $ E_{E}$, afin de permettre une nouvelle phase d'exploration, permettant si possible de trouver un chemin vers l'objectif.
next up previous contents
suivant: Problème du labyrinthe monter: Propriété d'incrémentalité de l'algorithme précédent: Découverte de l'ajout d'un   Table des matières
2002-03-01