suivant: Structuration du document
monter: Introduction aux termes clés
précédent: Introduction à la notion
  Table des matières
Introduction à la notion d'information perceptive
La deuxième partie de ce document est consacrée à la description,
puis à la formalisation du processus de catégorisation. Le rôle de
celui-ci est de produire une information perceptive, qui va
permettre de constituer les états du système. Ces états pourront être
utilisés dans le cadre de l'apprentissage d'un objectif: c'est notre
schéma d'un apprentissage à deux étages (voir la figure
3, page
). Nous souhaitons,
dans ce paragraphe, avertir le lecteur de la différence de signification
de notre terme information perceptive par rapport au sens du mot
information donné en théorie du signal.
Dans la théorie du signal, l'information est objective
(indépendante de l'observateur) et est portée par le signal lui-même.
Des critères sur le taux d'échantillonnage et le pas de quantification
existent, permettant de prouver la validité des transformations
analogique/numérique puis numérique/analogique (théorèmes d'échantillonnage
et de quantification de Shannon). Le principe de la caractérisation du
signal est de le décomposer dans une certaine base (base en sinus et cosinus,
pour la décomposition de Fourier, base en ondelettes, pour la décomposition
en ondelettes), pour en extraire les composantes principales. L'idée derrière
chaque système de décomposition est qu'on peut mesurer la perte d'information
lorsqu'on décide de restituer un signal ne comportant que certaines composantes
de cette base. Et, lorsque ce nombre de composantes retenues est suffisant,
il peut être possible de reconstruire fidèlement le signal d'origine. Par
conséquent, la notion d'information est liée à la capacité de reconstruire
un signal.
Notre notion d'information perceptive est radicalement différente.
Nous prévenons le lecteur que le formalisme que nous développons dans la
deuxième partie de ce document ne vise pas à établir un nouveau système de
décomposition du signal possédant des caractéristiques de réversibilité. En
voici les raisons principales.
L'information perceptive pourrait être rapprochée d'une
observation en tant que résultat d'un système visant à détecter
la présence d'un objet physique ou à caractériser une propriété
d'un objet. L'observation est un résultat dépendant à la fois du
système de mesure physique et de la présence ou de l'absence de
l'objet ou de la propriété au moment de l'expérience. Il existe
deux conséquences très importantes à cela, qui différencient
radicalement l'information perceptive de l'information de Shannon:
- l'interaction du système de mesure avec un objet qu'il n'a pas été
prévu de détecter n'aboutit à aucune détection d'information perceptive
- l'information perceptive est de nature qualitative
Le premier point est essentiel dans notre raisonnement. Il découle de notre
volonté de contraindre les sorties possibles de notre processus de
catégorisation (voir la section précédente). Notre idée est que, si on
prend un signal quelconque au cours du temps, la détection d'une information
perceptive à un moment donné de l'expérience est un événement rare,
alors que si on choisit un signal parmi ceux que le système a déjà expérimentés,
la non détection d'une information perceptive est alors un événement rare
(nous appellerons cela CO pour Contrainte d'Observabilité). Il nous faut
dire pourquoi nous avons besoin d'une telle contrainte, mais aussi pourquoi
celle-ci ne restreint pas les capacités du système de catégorisation en réalité
(elle les restreint de toute façon en théorie).
Imaginons qu'un système soit conçu pour pouvoir détecter plusieurs
informations perceptives. Une catégorie perceptive sera constituée
de l'ensemble des signaux aboutissant à la détection d'une
information perceptive particulière. Si chaque signal, pris dans
le temps, génère une information perceptive, c'est que la
catégorisation peut être vue comme un lien fonctionnel entre
l'espace des signaux
et l'ensemble des probabilités d'occurrence de
chacune des informations perceptives. Or, nous savons que, dans le
cas général, cette formalisation aboutit à des ambiguïtés (les
probabilités associées ne sont jamais égales à 1 ou à 0). L'idée
est de contraindre le processus de catégorisation de manière à
éviter cette ambiguïté. Ainsi, nous aimerions pouvoir dégager les
propriétés suivantes de notre processus de catégorisation:
- une erreur sur la nature d'une information perceptive détectée
est un événement rare en pratique (conséquence de CO)
- deux informations perceptives ne peuvent pas être détectées
simultanément (contrainte d'unicité ou CU )
Si on se place dans l'espace des signaux, ces propriétés visent à éloigner
les uns des autres les ensembles de signaux reliés à chaque information
perceptive. La contrainte CO indique que la mesure de l'union de ces
ensembles est très faible par rapport à celle de l'espace des signaux.
Nous suggérerons que ces propriétés limitent d'elles-mêmes le nombre
d'informations perceptives différentes que le système peut gérer, donc
le nombre de catégories de signaux, mais que celles-ci peuvent être
assimilées à des repères distinctifs, en référence à l'expérience
sur un robot mobile décrite dans la première section introductive.
Nos contraintes limitent-elles le champ applicatif d'un tel système.
En théorie, la réponse est positive: quelle que soit la dimensionnalité
de l'espace des signaux, un nombre très restreint de signaux génèrent
une information perceptive. Dans quels cas cette restriction est-elle
gênante ? Dans tous les cas où l'ensemble des signaux que nous utilisons
en réalité, c'est-à-dire dans une expérience précise, avec des
capteurs et un environnement déterminés, est ``gros'' par rapport à
l'espace des signaux, quelle que soit la valeur de la dimensionnalité
de celui-ci. Nous utilisons ici une hypothèse, qui nous semble très
réaliste: on peut rendre aussi faible qu'on souhaite le rapport entre
le ``volume'' de l'ensemble des signaux pris dans une expérience donnée
et le volume de l'espace des signaux, en augmentant la dimensionnalité
de cet espace. Nous nous trouvons face à un constat: si l'environnement
offrait en pratique une variété infinie de signaux possibles,
notre approche échouerait. Mais on peut remarquer qu'on aboutit alors
à la même conclusion que celle du cas des lymphocytes T décrit dans
notre avant-propos.
Ainsi, notre approche est totalement différente de celle adoptée
en traitement du signal: le fait qu'on ne puisse pas reconstruire
le signal à partir de l'information perceptive n'est pas
dommageable, car il s'agit précisément d'une condition obligatoire
pour garantir la fiabilité de l'information détectée.
suivant: Structuration du document
monter: Introduction aux termes clés
précédent: Introduction à la notion
  Table des matières
2002-03-01