next up previous contents
suivant: Modélisation d'un flux d'erreurs monter: Outils d'étude de l'incertitude précédent: Modélisation du flux d'erreurs   Table des matières


Modélisation d'un flux d'erreurs mono-causal

Nous allons nous intéresser à la modélisation d'un flux d'erreurs lorsqu'il existe une seule cause d'erreur, paramétrisée par sa fréquence d'occurrence $ \epsilon $.
Considérons un processus dynamique dont l'occurrence d'états non-viables peut être modélisée par une chaîne de Markov à deux états V (pour ``viable'') et T (pour ``terminal''): voir la figure 1.5. Il existe trois transitions: l'une de V vers V, possédant une probabilité de franchissement de $ 1 - \epsilon$, avec $ \epsilon \in ]0,1[$, une autre de V vers T, possédant une probabilité de franchissement de $ \epsilon $, puis une troisième de T vers V, possédant une probabilité de transition 1. Cette dernière simule la réinitialisation du système après l'état terminal.
À l'instant initial, le processus se trouve dans l'état V. À chaque pas de temps k, le passage de l'état V à l'état T est formalisé par une variable aléatoire discrète $ X_{k}$ à valeur dans 0,1, suivant une loi de Bernoulli de paramètre $ \epsilon $. La valeur de la réalisation $ x_{k}$ de $ X_{k}$ possède la signification suivante: si $ x_{k}$ vaut 0, le processus reste dans l'état V à l'instant k+1, sinon il passe dans l'état terminal T et, à l'instant k+1, il se retrouve dans l'état V.
Nous allons nous intéresser au nombre de pas de temps durant lesquels le processus reste dans l'état V sans passer par l'état T. Pour cela, considérons la variable aléatoire discrète $ S_{n, n
\in \mathbb{N}^{*}}$, définie à partir des $ X_{k, k \leq n}$ de la manière suivante:

$\displaystyle S_{n} = \sum_{k=0}^{n}X_{k}$    

La variable aléatoire $ S_{n}$ est directement liée à ce nombre de pas de temps, puisque la réalisation $ s_{n}$ vaut 0 uniquement dans le cas où le processus est resté dans l'état V pendant n pas de temps. L'espérance $ E[S_{n}/n]$ correspond au nombre moyen d'erreurs par unité de temps.
Deux points vont nous intéresser:
  1. on considère que la valeur de $ \epsilon $ est connue: comment obtenir la loi de la durée (nombre de pas de temps) séparant deux passages dans l'état T ?
  2. on considère que la valeur de $ \epsilon $ est inconnue: comment estimer la valeur de $ \epsilon $ grâce à une réalisation $ s_{n}$ de $ S_{n}$ ?
Considérons le point 1. Nous allons faire l'hypothèse que les $ X_{k}$ sont indépendantes. Il est connu que $ S_{n}$ suit une loi binomiale $ B(n,\epsilon)$:

$\displaystyle P(S_{n} = k) = C_{n}^{k} \epsilon^{k}(1 - \epsilon)^{n-k}$    

Le nombre de pas de temps entre l'instant initial et l'instant du premier passage dans l'état T est une variable aléatoire N vérifiant:

$\displaystyle P(N=k) = P(S_{k} = 0, X_{k+1} = 1)$    

Les deux événements étant indépendants, il vient:

$\displaystyle P(N=k) = P(S_{k} = 0).P(X_{k+1} = 1) = \epsilon (1 - \epsilon)^{k}$ (3)

La probabilité pour que le nombre de pas de temps consécutifs dans l'état V soit inférieure à n est donc:

$\displaystyle P(N \leq n) = \sum_{k=0}^{n}P(N=k) = 1 - (1 - \epsilon)^{n+1}$ (4)

Considérons à présent le point 2. Calculons en premier lieu l'espérance et la variance de N grâce à l'équation 1.3. Il vient (voir l'annexe A.3):

$\displaystyle E[N] = 1 / {\epsilon}$    

Et

$\displaystyle Var[N] = \frac{1 - \epsilon}{\epsilon^{2}}$    

Lorsque $ \epsilon $ est suffisamment petit, l'écart-type de N est presque égal à $ 1 / {\epsilon}$, c'est-à-dire E[N].
Si on considère un p-échantillon $ n_{1},n_{2},...,n_{p}$ de N, grâce à la méthode du maximum de vraisemblance, on peut donner un estimateur $ \hat{\epsilon}$ (voir l'annexe A.4):

$\displaystyle \hat{\epsilon} = \frac{1}{\frac{1}{p}\sum_{k=1}^{p}n_{k} \: + \: 1}$ (5)

L'échantillon nous permettra d'établir un histogramme de la fonction de répartition réelle des durées de viabilité pour le comparer graphiquement avec la fonction de répartition théorique utilisant l'estimation de $ \epsilon $ comme paramètre. Un exemple de fonction de répartition de N est donnée par la figure 1.7, pour $ \epsilon =10^{-5}$.

Figure: Exemple de fonction de répartition des durées de viabilité, obtenu pour $ \epsilon =10^{-5}$
\includegraphics[]{fig/densite_1.eps}

Voici à présent quelques exemples numériques. Admettons que le flux d'événements ``non-viables'', issus d'un processus dynamique en temps discret, soit modélisable en utilisant la variable aléatoire S, avec un paramètre $ \epsilon $ et que le pas de temps vaille 0.02 s. Le nombre moyen d'erreurs est $ E[S_{n}] = n \epsilon$. La valeur maximum de $ \epsilon $ pour qu'il y ait en moyenne une erreur par an est: $ \epsilon \simeq 6.34 10^{-10}$.
Si, à présent, on constate qu'un processus n'est jamais passé par l'état terminal pendant n pas de temps, on peut obtenir une majoration du nombre moyen d'erreurs par jour, avec une certaine confiance. Pour une confiance de 0.99, il suffit de déterminer n pour obtenir P($ S_{n}$=0) = 0.99 . Pour $ n=10^{5}$ (près de 3 minutes, avec un pas de temps de 0.02 s), on obtient $ \epsilon <
10^{-6}$. Grâce à l'expression $ E[S_{n}]$, on en déduit que la majoration du nombre d'erreurs moyen par jour est d'environ 4. Si on voulait garantir que cette majoration soit d'une erreur par an, il aurait fallu continuer à observer le processus pendant un peu plus de trois jours.
next up previous contents
suivant: Modélisation d'un flux d'erreurs monter: Outils d'étude de l'incertitude précédent: Modélisation du flux d'erreurs   Table des matières
2002-03-01