Thématiques de recherches
Depuis le début de ma thèse ma thématique de recherche porte sur la robotique autonome bioinspirée appliquée à une tâche de navigation planifiée.
L’autonomie d'un robot peut se traduire par l’expression de comportements adaptatifs et non supervisés, lui permettant d’agir pour réaliser certaines tâches nécessaires à sa mission dans l’environnement dans lequel il se trouve. Or cet environnement est le plus souvent dynamique (objets déplacés, peronnes ou objets en mouvements ...).
Problématiques
La robotique autonome est alors caractérisée par une classe de problèmes qui ne sont pas entièrement spécifiables à l’avance et nécessite donc des structures adaptatives permettant la résolution dynamique des problèmes. L’une des techniques permettant l’émergence de ce comportement adaptatif est l’apprentissage. L’idée étant que le robot puisse extraire les informations de l’environnement qu’il juge pertinentes pour adapter son comportement.
Quelles sont ces informations que le robot doit apprendre? Comment peut-il les obtenir, les apprendre et les exploiter, sont des questions auxquelles il est nécéssaire de trouver des réponses./p>
Une approche bioinspirée
L’étude
des animaux en éthologie, en neurobiologie ainsi que
d’en d’autres disciplines (comme la psychologie)
peut
surement apporter des éléments de
réponse. En effet, les animaux
possèdent des mécanismes de navigation
très souples et robustes : ils
doivent passer une grande partie de leur temps à se
déplacer d’un
endroit à un autre et cela pour des questions de survie
(trouver de la
nourriture, de l’eau, retourner à leur habitat).
Par
ailleurs, les chemins empruntés, mêmes
s'ils sont parfois
sous-optimaux d’un point de
vue mathématique, n’en sont pas moins
rapidement sélectionnés,
flexibles, et efficaces dans la mesure où ils permettent la
survie de
l’animal! Les comportements de navigation des animaux peuvent
être, par
conséquent, caractérisés par une
auto-adaptation, robuste et fiable, aux
caractéristiques changeantes de leur environnement et cela,
naturellement, de façon autonome (sans supervision externe).
Cette
faculté d’adaptation à
un environnement dynamique,
est une qualité dont on souhaiterait doter nos robots
mobiles.
Le défi consiste alors à comprendre et à extraire les mécanismes mis en jeu dans la génération d’un comportement animal afin de les mettre en oeuvre dans nos propres architectures robotiques.
La communauté des sciences cognitives nous fournit les cléfs pour élaborer nos modèles dans le cadre d'une approche neuromimétique.En effet, les neurobiologistes proposent des organisations structurelles et fonctionnelles du cerveau dont nous pouvons nous servir pour constituer la trame de nos architectures. De plus, les travaux des psychologues et des éthologues, qui étudient les mécanismes cognitifs sous-jacents des comportements animaux, nous guident dans la construction de notre modèle. Enfin, l’informatique et le connexionnisme nous fournissent le support de notre modélisation.
Ainsi, depuis le début de ma thèse, mon effort de recherche porte sur la compréhension et la modélisation des mécanismes cognitifs mis en oeuvre chez les mammifères lors de tâches navigation. Pour y parvenir, nous adoptons une démarche constructiviste qui poursuit un double objectif :- D’une part, aider à la compréhension des mécanismes mis en jeu dans l’émergence de comportement en fournissant une architecture minimaliste (que l’on peut complexifier progressivement), capable de rendre compte d’un certain nombre d’observations provenant de l’étude du vivant .
- D’autre part, elle s’inspire des solutions retenues par la nature et mises en évidence par les neurobiologistes afin de proposer des architectures de contrôle robotiques dotées de caractéristiques similaires, que ce soit en terme d’adaptabilité, d’efficacité, ou de robustesse, tout en en maıtrisant la complexité.
La granulartité de l'architecture se situe à un niveau de modélisation fonctionnelle, permettant un compromis entre efficacité de l’architecture et précision de la modélisation neurobiologique tout en tenant compte des contraintes temps réel du contrôle du robot, d'où le choix d'une approche neuromimétique. De plus, pour faire face à l’ensemble des problèmes d’adaptation et de propagation des différents flux d’information posés par la robotique autonome, une architecture de contrôle neuronale est particulièrement bien adaptée :
- les modèles à base de réseaux de neurones permettent de synthétiser et analyser ces systèmes au niveau atomique, ici pris comme celui du neurone "formel". Le caractère analogique de l’information (l’activité des neurones) et son unicité permet aisément de mettre en relation des informations issues de modalités différentes et tend à réduire le fossé entre contrôle (l’automatisme) et intelligence artificielle en supprimant les ”symboles”.
- le découpage en réseaux de neurones permet d’obtenir un coût computationnel correct en favorisant le parallélisme du traitement de l’information globale
- l’apprentissage permet, au travers de lois de modifications des poids synaptiques, de catégoriser en ligne l’information.
Lorsqu'il est engagé dans une tâche de navigation planifiée, son contrôle soulève des problèmes relatifs :
- aux traitements et à l'apprentissage des informations sensorielles multimodales et motrices, permettant, entre autre, au robot de se localiser
- et à la sélection de l’action ( pour la planification de trajet jusqu'à un lieu but).
Il
est par conséquent naturel de
s’intéresser aux structures biologiques
qui sont le support de ces mécanismes. L'hippocampe est une
structure
clef dans l'apprentissage d'évènements
spatio-temporaux. De plus il est
reçoît et emet des informations à
d'autres structures suspectées d'être
impliquées dans les processus de planification (cortex
préfrontal) et
de sélection de l'action (ganglions de la base, dont
l'accumbens). De
façon plus précise, nos études visent
à une l'interprêtation
fonctionnelle des interactions entre l’hippocampe (HS), le
cortex
enthorinal (EC), le gyrus dentée (DG), le cortex
préfrontal (PF) et le
nucléus accumbens (ACC) (Cf figure 1). Ce
système de traitement
de l’information spatiale et de navigation repose sur une
cascade de
processus d’association de complexité croissante
(cf travaux de thèse).

figure 1: La boucle hippocampique et ses interactions
Une approche inspirée des animats et des agents situés
Nous avons également choisi de nous inspirer des approches animat et des agents situés : le comportement du robot doit être le fruit de l’interaction système-environnement. L’agent peut alors se servir de sa propre expérience dans une situation particulière pour la combiner avec la sitution actuelle afin de déterminer l’action à entreprendre. Il existe donc un couplage entre l’agent et la situation dans laquelle il doit agir. Ce couplage consitue la principale différence avec un agent réactif puisqu’un agent réactif n’incorpore pas son expérience passée dans son processus de décision.
Afin de mener à bien sa tâche, un robot autonome doit parvenir à traiter les flux numériques en provenance de ses capteurs en ne retenant que ce qui est pertinent dans son comportement. Par conséquence, nos architectures doivent :
- être en mesure d'extraire et d’exploiter les principales propriétés et régularités d’un environnement complexe.
- être capable d’apprendre les relations entre ses sensations et ses actions pour reproduire une action précédemment apprise dans un contexte sensitif donné.
L’expérience que le robot
situé a acquise dans
son
environnement s’exprime alors grâce aux
différents
apprentissages réalisés dans nos
réseaux de
neurones,
sous la forme des différentes matrices de poids de
connexions.
Les différents apprentissages réalisés
en ligne dans nos architectures sont non supervisés : le
système ne dispose en entrée que
de sensations dont il faut extraire des
régularités pour
en réaliser une classification. Ces
apprentissages influencent les actions choisies et
réalisées par notre agent qui
elles-mêmes vont
en retour modifier ses sensations. Nous croyons en un couplage fort
entre les sensations et
les actions. Ceci ce traduit dans nos modèle par
l'apprentissage
et la
prédiction d'éléments sensorimoteurs.
Ainsi des
séquences
séquences sensori-motrices peuvent être
apprises,
réutilisées et manipulées au
moment opportun
(planification).
Les prototypes issus de cette catégorisation de
l’environnement par
l’agent peuvent ainsi être ancrés
physiquement
puisqu’ils sont le
résultat d’une acquisition
réalisée par les
interactions de l’agent et
de son environnement et sont par cons´quent construits de son
propre
point de vue et non de celui de l’observateur externe. Ce
type de
démarche est à rapprocher de la perspective
écologique des mécanismes
perceptifs et cognitifs proposée par Gibson (Gibson, 1979).
Recherches Actuelles (A.T.E.R)
Mes travaux de recherches actuels portent sur l'apprentissage et l'utilisation d'une information contextuelle visuelle. L'application porte sur la neuromodulation de la population cellules de lieu (voir mes travaux de thèse). Les modèles développés doivent permettre l'apprentissage et l'utilisation de l'information contextuelle en-ligne et de façon autonome.
Les objectifs sont multiples:
- permettre le changement d'échelle. L'information contextuelle permet de regrouper en cluster cohérents des cellules de lieu spatialement proches. Ceci permettrait, d'une part, de découper de grands environnements et de faciliter la planification en grands environnements. D'autre part, d'un point de vue computationnel, cela permet de réduire l'espace de recherche en activant qu'un ou plusieurs sous-ensembles de la population de cellules de lieu, en diminuant ainsi le coup.
- Rendre compte du remapping des cellules de lieu
(combiné
avec un apprentissage en population de cellules de lieu)
Ainsi, le sujet de mes recherches actuelles se situe dans le prolongement directe de mon post-doctorat, c'est pourquoi je continue, en parrallèle de ces travaux, à collaborer avec l'équipe de Perception Située du LIMSI.
MOTS-CLE: contexte, cellules de lieu
(Cliquez ici pour en savoir plus...)
Recherches Post-doctorales
Mes travaux de recherches de thèse m'ont permi de me confronter aux problèmes soulevés par la perception robotique. Ce thème fait l'objet de nombreuses recherches, car il sagit d'un problème incontournable pour la création d'architecture robotique autonome. J'ai alors choisi de continuer mes travaux dans le domaine de la robotique située. C'est pourquoi j'effectue actuellement un post-doctorat au sein de l'équipe de Perception Située du LIMSI sous la direction de Philippe Tarroux.
Ce sujet de recherche se situe dans le prolongement de celui de ma thèse. Il porte sur la vision robotique (mécanismes attentionels) et plus exactement sur les mécanismes mis en oeuvre lors des saccades occulaires et leurs rôles dans la reconnaissance d'environnement.
MOTS-CLE: Vision robotique, modèle neuronal bioinspiré, contexte, mécanismes attentionnels, séquences
(Cliquez ici pour en savoir plus...)
Travaux de thèse
Durant ma thèse, mon effort de recherche, sous la direction de Mathias Quoy, a porté sur la compréhension et la modélisation des mécanismes de planification et de navigation mis en oeuvre chez les mammifères.
Nous proposons ainsi une architecture intégrée de contrôle robotique qui unifie la planification et le sensorimoteur en supprimant le fossé entre planification et contrôle moteur. Nous montrons comment, de par les concepts de construction employés et les différents enrichissements opérés sur les flux d'information qui en résulte, nous pouvons obtenir une architecture dotée de capacités à planifier des séquences sensori-motrices dans le cadre d'un comportement de navigation.
Ces travaux s'inscrivent dans deux ACI auxquelles j'ai participées : Neurosciences Computationnelles et Temps et Cerveau (voir la section Insertion dans la communauté scientifique).
MOTS-CLE: navigation, planification, réseaux neuromimétiques, apprentissage, perception visuelle, cellules de transition.
Telecharger ma thèse : ici
(Cliquez ici pour en savoir plus...)
Autres sujets qui m'interessent :
- L'étude de systèmes dynamiques : les réseaux de neurones récurrents aléatoires (voir ACI, la page du groupe de neurocybernétique d'ETIS et la page de Mathias Quoy).
- Je me suis également intéressé au comportements collectifs au-travers de simulation multi-agents (voir la page de mon stage de DEA)
Insertion dans la communauté scientifique
-
ACI Temps et Cerveau, étude de la dynamique de réseaux de neurones récurrents aléatoires avec M. Samuelides (SupAero, Toulouse), G. Beslon (lN SA, Lyon), et E. Dauce (Perception et mouvement, Marseille). Cette ACI m'a permis de me mettre en relation les résultats obtenus par ces réseaux de neurones à dynamiques chaotiques avec celles observées dans la boucle hippocampique.
-
ACI Neurosciences Computationnelles, étude d'un modèle des interactions entre l'hippocampe, le cortex préfrontal et les ganglions de la base, impliqué dans la navigation des rats et l'implémentation sur robots mobiles en collaboration avec B. Poucet (CRNC, Marseille) IP. Banquet (INSERM U483) et R. Chatila (LAAS, Toulouse). Cette ACI m'a permis d'échanger avec des neurobiologistes de nombreuses et précieuses informations issues de leurs études sur le comportement de navigation des rats.
-
Projet Géomatique, projet C.N.R.S sur l'étude théorique de la dimention spatio-temporelle des comportements, mené conjointement avec l'Institut d'Economie Régionale du Sud Ouest de l'Université Montesquieux (Bordeaux- IV) et le département d'Intelligence Artificielle et Sciences Cognitives de l'E.N.S.T Bretagne. Ce projet fut ma première coopération (qui commença durant mon DEA) et me permis d'apprécier la richesse d'une collaboration interdisciplinaire.