Les publications de Shirley Hoet :
Les livres
Aucun ouvrage lié à cet auteur.
Les articles
Simplification de la mémoire des agents en utilisant des FMDP
Auteurs :
Shirley Hoet,
Nicolas SabouretDans cet article, nous nous intéressons à
la problématique de l'apprentissage par
renforcement dans un cadre multi-agent
asynchrone et faiblement couplé. Nous
montrons qu'il est nécessaire de mémoriser
des informations sur les actions passées
et nous montrons comment factoriser
cette information mémorisée pour que
l'espace d'états reste praticable en nous
appuyant sur le modèle des processus décisionnels
de Markov factorisés (FMDP).
Nous définissons un mécanisme d'apprentissage
qui intègre les actions et les observations
passées et nous expliquons comment
ce modèle est implanté dans notre
plateforme et nous discutons les résultats
attendus.
In this paper, we tackle the problem of
reinforcement learning in the context of
asynchronous and loosely coupled multiagent
systems. We show that it must memorize
informations about its past actions
and factorize this information in order to
keep the state space at a practicable size.
We define a learning mechanism based
on Factorized MDPs that integrates the
agent's past actions and observations and
we explain how this model is implemented
in our platform and we discuss the expected
results.
Article édité dans l’ouvrage
Auteur :
Collectif JFSMA
Contributeurs :
Miguel Aubouy,
Dominique Duhaut,
Mohamed Hédi Bedoui,
Shirley Hoet,
Nicolas Sabouret,
Benoît Vettier,
Laure Amate,
Pierre Baconnier,
Catherine Garbay,
Cécile Duchêne,
Guillaume Touya,
Javier Gil-Quijano,
Cédric Herpson,
Nicolas Sabouret,
Vincent Couturier,
Marc-Philippe Huget,
David Telisson,
Fabien Michel,
Jacques Ferber,
Pierre-Alain Laur,
Florian Aleman,
Philippe Caillou,
Inès Hassoumi,
Christophe Lang,
Nicolas Marilleau,
François Bouchet,
Jean-Paul Sansonnet,
Jérémy Rivière,
Sylvie Pesty,
Tomás Navarette Gutierrez,
Julien Siebert,
Laurent Ciarletta,
Vincent Chevrier,
Antoine Nongaillard,
Philippe Mathieu,
Patricia Everaere,
Flavien Balbo,
Olivier Boissier,
Fabien Badeig,
Zied Sellami,
Valérie Camps,
Marie-Pierre Gleizes,
Sylvain Rougemaille,
A. Belkaïd,
A. Ben Saci,
Laure Bourgois,
Ali-Mhammed Oulhaci,
Jean-Michel Auberlet,
Grégory Bonnet,
Guillaume Doyen,
Sébastien Picault,
Philippe Mathieu,
Yoann Kubera,
Julien Perret,
Florence Curie,
Julien Gaffuri,
Anne Ruas
Collection :
JFSMA
Rubrique :
Données – informatique – I.A. – IHM
Référence : 94904
Un modèle de mémoire pour l'apprentissage de communication dans un SMA [présentation courte
Auteurs :
Shirley Hoet,
Nicolas SabouretL'apprentissage de comportement dans un contexte multi-agent est un problème difficile, en particulier parce que la prise en compte de la communication avec les autres agents requiert la mémorisation d'informations spécifiques. Dans cet article, nous présentons les modèles de mémoire existants et nous montrons qu'ils ne permettent pas de gérer l'apprentissage de communication. Nous proposons ensuite un modèle de mémoire pour l'apprentissage par renforcement des messages de commande (request) et de contrôle (query). Ce modèle permet de gérer l'asynchronisme du système et les attentes de réponses aux messages. Enfin, nous présentons une évaluation de ce modèle sur un exemple simple et nous montrons qu'il construit une politique en un temps raisonnable et avec un espace mémoire réduit.
Learning in a multi-agent context is a difficult task, especially since the communication with other agents require additional information to be stored and used in the learning process. In this paper, we propose a model of agent memory for command and control in a multi-agent context. We first show why the existing memory models are not sufficient to support automated learning of command and control in a multiagent context. Then, we describe our model for storing messages and answers. Finally we show on an example that this model allows faster learning and better convergence.
Article édité dans l’ouvrage
Auteur :
Collectif JFSMA
Contributeurs :
Franco Zambonelli,
Grégory Bonnet,
Fabien Delecroix,
Maxime Morge,
Jean-Christophe Routier,
Credo Paniah,
Javier Gil-Quijano,
David Mercier,
Philippe Mathieu,
Sébastien Picault,
Édouard Amouroux,
Thomas Huraux,
François Sempé,
Nicolas Sabouret,
Yvon Haradji,
Patrick Simo-Kanmeugne,
Aurélie Beynier,
Jean-Yves Donnart,
Matthis Gaciarz,
Philippe Mathieu,
Yann Secq,
Shirley Hoet,
Nicolas Sabouret,
Kevin Darty,
Julien Saunier,
Nicolas Sabouret,
Jean-Paul Sansonnet,
François Bouchet,
Nicolas Sabouret,
Hazaël Jones,
Julien Saunier,
Quentin Reynaud,
Vincent Corruble,
Samuel Lemercier,
Jean-Michel Auberlet,
Quang-Anh Nguyen-Vu,
Salima Hassas,
Benoît Gaudou,
Richard Canal,
Frédéric Armetta,
M.-H. Nguyen,
D. Villanueva,
R. Le Riche,
R.-T. Haftka,
Omar Rihawi,
Yann Secq,
Philippe Mathieu,
Jean-Paul Jamont,
Michel Occello,
Fabien Michel,
Gauthier Picard
Collection :
JFSMA
Rubrique :
Données – informatique – I.A. – IHM
Public concerné :
Spécialistes
Mots clés :
IHM,
Informatique,
intelligence artificielle,
traitement données
Référence : 107209