next up previous contents
suivant: Découverte des sources d'erreur monter: Expérimentations autour du problème précédent: Protocole expérimental   Table des matières


Analyse des mesures $ H_{1}$ et $ H_{2}$ lorsque la qualité des données d'entrée est dégradée

Figure: Graphes associés à la sous-section 1.4.4
\includegraphics[]{fig/res_H_entree.eps}
Légende:
``EVH'' Évolution de la Valeur de $ H_{1}$ et de $ H_{2}$ (abscisses: amplitude du bruit de mesure, taux de valeurs aléatoires [0.1 = 10%]; ordonnées: valeur normalisée de $ H_{1}$ et/ou de $ H_{2}$).
``EHMR'' Évolution de la valeur de $ H_{1}$ en fonction du taux de Mauvaise Reconnaissance de l'état courant du système.
``DG'' Données issues de $ \theta$ bruitées avec un bruit gaussien, d'amplitude $ \sigma $.
``DVA'' Données issues de $ \theta$ possédant un taux de valeurs aberrantes $ \tau_{VA}$.
``EA'' L'état du système peut être choisi aléatoirement, avec une fréquence d'apparition $ \tau_{EA}$.
Commentaires:
Les graphes (a),(b) et (c) montrent l'évolution des valeurs de $ H_{1}$ et $ H_{2}$ lorsque l'amplitude du bruit de mesure augmente, suivant les trois types de bruits. Les graphes (d), (e) et (f) sont construits respectivement à partir de (a), (b) et (c), en considérant une échelle log/log. L'intérêt est de contater que lorsque l'amplitude du bruit est faible, $ H_{1}$ peut se mettre sous la forme $ b.\tau^{a}$, avec $ \tau$ l'amplitude du bruit de mesure, et a et b les paramètres des droites constatées dans les graphes (d),(e) et (f) lorsque $ \tau$ est suffisamment faible. Enfin, les graphes (g), (h) et (i) montrent qu'il existe une relation fonctionnelle entre le taux de mauvaise reconnaissance de l'état courant du système et la valeur de $ H_{1}$. On s'aperçoit que s'il existe une corrélation quasi-linéaire pour un bruit ``DG'', pour les deux autres bruits, $ H_{1}$ augmente beaucoup plus vite que le taux de mauvaise reconnaissance.

Avant d'entamer l'étude des résultats d'apprentissage, étudions le comportement des mesures $ H_{1}$ et $ H_{2}$ lorsque les paramètres du contexte d'apprentissage changent: la qualité de l'entrée $ \theta$ (bruit gaussien d'amplitude $ \sigma $ variable, taux variable de données aberrantes) ou la nature de l'état courant du système (l'état du système peut être choisi aléatoirement avec un taux variable) [*]. Si $ H_{1}$ et $ H_{2}$ sont capables de mesurer la qualité du contexte d'apprentissage, il faut vérifier si les conditions suivantes sont remplies:
  1. $ H_{1}$ et $ H_{2}$ doivent être deux fonctions strictement croissantes de l'amplitude du bruit de mesure
  2. les variations de $ H_{1}$ et de $ H_{2}$ doivent être suffisamment importantes
Les graphes (a),(b) et (c) de la figure 1.10 montrent précisément l'évolution de $ H_{1}$ et de $ H_{2}$ en fonction de l'amplitude du bruit de mesure, pour chacune des catégories de bruit. Les calculs de $ H_{1}$ et de $ H_{2}$ sont obtenus en utilisant l'algorithme 1.1, page [*], avec une valeur du paramètre N égale à 100 millions d'itérations. Nous remarquons que la première condition est remplie par $ H_{1}$ et $ H_{2}$, mais que les variations de cette dernière ne sont pas assez importantes pour les graphes (a) et (b) (bruit gaussien et introduction de valeurs aberrantes de $ \theta$). Dans la suite de cette sous-section, nous donnerons une explication à cette faible variation. Mais, pour l'instant, nous allons nous intéresser plus précisément à $ H_{1}$, qui répond à nos deux conditions. Les graphes (d), (e) et (f) de la figure 1.10 précisent l'évolution de $ H_{1}$ lorsque l'amplitude du bruit de mesure est faible (échelle log/log). On constate une relation linéaire, à l'échelle log/log, entre l'amplitude du bruit et $ H_{1}$, ce qui signifie que $ H_{1}$ peut être mise sous la forme $ b.\tau^{a}$, $ \tau$ représentant l'amplitude du bruit de mesure et ``a'' la pente de la droite. Cette pente a dépend de la nature du bruit: elle vaut environ 0.9 si le bruit est gaussien (assimilation linéaire valide pour une amplitude inférieure à 0.02), environ 2.6 s'il existe un taux de mesures aberrantes de $ \theta$ (assimilation linéaire valide pour une amplitude inférieure 0.1) et environ 12.4 suivant le taux de choix aléatoire de l'état courant (assimilation linéaire valide pour une amplitude inférieure 0.05). $ H_{1}$ permet donc de discriminer les trois catégories de bruit de mesure. Ainsi, des pentes à l'origine différentes indiquent des amplitudes de dégradation du contexte d'apprentissage différentes, qui sont cohérentes avec notre intuition: l'augmentation du taux de choix d'un état aléatoire aboutit plus rapidement à un contexte d'apprentissage dégradé que celle du taux de valeurs aberrantes de $ \theta$, et plus rapidement encore que celle de l'amplitude $ \sigma $ d'un bruit gaussien. $ H_{1}$ est donc un bon indicateur de la dégradation du contexte d'apprentissage due à l'introduction d'un bruit de mesure.
Un autre indicateur de la dégradation du contexte d'apprentissage en présence d'un bruit de mesure serait le taux de mauvaise reconnaissance de l'état courant. L'état courant est mal reconnu s'il est différent de l'état théorique, obtenu avec des données non-bruitées. Les graphes (g), (h) et (i) de la figure 1.10 montrent le lien fonctionnel qui existe entre ce taux de mauvaise reconnaissance et $ H_{1}$, pour les trois catégories de bruits de mesure. On remarque que $ H_{1}$ possède une relation linéaire forte avec le taux de mauvaise reconnaissance, pour des valeurs de ce dernier inférieures à 0.55 (graphe (g)), alors que les deux autres graphes montrent une convergence exponentielle vers le taux maximal de mauvaise reconnaissance, avec une pente à l'origine nettement supérieure à 1. On en déduit que la mesure $ H_{1}$ est nettement plus sensible que le taux de mauvaise reconnaissance à la détérioration de la qualité des données d'entrée par l'introduction de mesures aberrantes. Par contre, $ H_{1}$ est équivalente à la mesure du taux de reconnaissance lorsqu'on introduit un bruit gaussien.
L'avantage de $ H_{1}$ par rapport au taux de mauvaise reconnaissance est donc résumé par les deux points suivants: Revenons à la différence de comportement de $ H_{1}$ et de $ H_{2}$, constatée dans les graphes (a) et (b). Que signifie-t-elle ? Rappelons que $ H_{2}$ mesure la capacité à déterminer l'action qui a permis le passage d'un état $ e_{i}$ à un état $ e_{j}$, connaissant $ e_{i}$ et $ e_{j}$. La faible variation de $ H_{2}$, même pour des amplitudes très importantes du bruit de mesure, signifie que cette capacité n'est, curieusement, pas beaucoup dégradée. La différence essentielle entre les bruits des graphes (a) et (b) d'une part, et celui de (c) d'autre part, est que les deux premiers impliquent uniquement l'entrée $ \theta$. Cela signifie que, dans ces deux cas, si on prend deux états successifs atteints par le système, une mauvaise reconnaissance de l'un ou l'autre des états, en raison du bruit introduit sur $ \theta$, ne change pas beaucoup la qualité de la prédiction sur l'action qui a provoqué ce changement: on en déduit que la variable $ \theta$ est peu discriminante pour cette prédiction. Ce résultat s'explique par les caractéristiques du problème du pendule inversé: la variable amenant le plus fréquemment un changement d'état est $ \dot{\theta}$, qui devient positive ou négative en très peu d'itérations, suivant la direction de la force qui est appliquée au chariot (cela est dû à la faible inertie de la tige). $ H_{2}$ est donc un indicateur utile, puisqu'il montre que la variable $ \theta$ est moins discriminante que ce qu'on pourrait penser intuitivement. En particulier, $ H_{2}$ nous a permis de constater qu'un découpage beaucoup plus grossier de l'axe $ \theta$ suffirait.
En conclusion, nous venons de montrer l'intérêt de l'utilisation des mesures $ H_{1}$ et $ H_{2}$. Dans notre expérience, nous avons montré que $ H_{1}$ peut effectivement qualifier la dégradation de la qualité du contexte d'apprentissage due à l'introduction d'un bruit de mesure. Des expériences, que nous ne faisons pas figurer dans ce document, montrent une faible influence d'une modification des limites du découpage selon $ \theta$ sur la valeur de $ H_{1}$ et de $ H_{2}$. Elles confirment les résultats, apparemment étonnants, obtenus en étudiant $ H_{2}$, qui montrent qu'une dégradation des données mesurant $ \theta$ n'influencent pas beaucoup la valeur de $ H_{2}$. Nous avons déduit de ces deux résultats que $ \theta$ est beaucoup moins discriminante que ce qu'on pourrait penser intuitivement.
Un résultat découlant de notre étude est que notre modélisation du problème du pendule inversé ne fournit pas un contexte d'apprentissage respectant la propriété ( $ P_{\epsilon }$): les valeurs de $ H_{1}$ et de $ H_{2}$ sont loin d'être proches de 0, même lorsque les données d'entrée sont parfaites.
next up previous contents
suivant: Découverte des sources d'erreur monter: Expérimentations autour du problème précédent: Protocole expérimental   Table des matières
2002-03-01