Les Journées Francophones sur les Systèmes Multi-Agents (JFSMA) sont un moment privilégié d’échanges scientifiques transversaux. Chaque année, elles réunissent des chercheurs qui étudient, utilisent et font évoluer le paradigme multi-agent pour adresser des problématiques issues de domaines liés à l’informatique (intelligence et vie artificielle, génie logiciel, robotique collective, etc.), à l’automatique et aux sciences humaines et naturelles (économie, sociologie, éthologie, etc.).
Cet ouvrage rassemble les 14 articles de l’édition 2020 des JFSMA, portant sur des sujets variés dans le domaine des Systèmes Multi-Agents : la simulation, la décision distribuée, l’habitat intelligent, la synchronisation, l’optimisation distribuée, l’émergence et les agents virtuels.
Précédentes éditions des JFSMA : Toulouse (1993), Grenoble (1994), Chambéry (1995), Port-Camargue (1996), Nice (1997), Nancy (1998), L’Île de la Réunion (1999), Saint-Étienne (2000), Montréal (2001), Lille (2002), Hammamet (2003), Paris (2004), Calais (2005), Annecy (2006), Carcassonne (2007), Brest (2008), Lyon (2009), Mahdia (2010), Valenciennes (2011), Honfleur (2012), Lille (plateforme IA, 2013), Valence (2014), Rennes (2015), Rouen (2016), Caen (2017), Métabief (2018), Toulouse (2019).
Table des matières
N. SABOURET
Avant-propos
SIMULATION ET AGENTS VIRTUELS
M. BOURGAIS, P. TAILLANDIER, L. VERCOUTER
BEN : Une architecture pour des agents cognitifs, affectifs et sociaux dans la simulation
J. SAUNIER AND A. PAUCHET
Interactions dans les Communautés Mixtes Humains-Agents : Etat de l’Art
P. COLLARD
Micro-motivations du Second Ordre : application à la ségrégation spatiale
HABITAT INTELLIGENT
J. ALBOUYS-PERROIS, N. SABOURET, Y. HARADJI, M. SCHUMANN, B. CHARRIER, C. INARD
Étude de différentes configurations d’autoconsommation collective de l’énergie à l’échelle du quartier à l’aide de la simulation multi-agent
I. F. TRENTIN, F. RAMPARANY, O. BOISSIER
Intégration de la Gestion du Contexte et des Dispositifs IoT dans des Maisons Intelligentes basées sur des Systèmes Multi-Agents
DÉCISION ET APPRENTISSAGE
K. A. ALARCON, M.-P. GLEIZES, L. CAROUX, E. KADDOUM, V. CAMPS, S. COMBETTES
ReCoVac : Décision autonome de reprise de la conduite d’un véhicule autonome et connecté
N. COINTE, A. GHORBANI, C. CHORUS
Un processus pour la sélection de stratégie de gestion de l’information dans les systèmes de confiance
B. DATO, M.-P. GLEIZES, F. MIGEON
Stratégie d’apprentissage proactif endogène par systèmes multi-agents coopératifs
SYSTÈMES DISTRIBUÉS
G. PICARD, P. RUST
Analyse des performances d’algorithmes DCOP pour l’association d’utilisateurs de réseaux HetNets
A. ROUSSET, P. BREUGNOT, B. HERRMANN, C. LANG, L. PHILIPPE
Politiques de synchronisation dans les systèmes multi-agents distribués parallèles
SIMULATION ET ÉMERGENCE DE COMPORTEMENTS
S. PICAULT, V. SICARD
Les meilleurs agents sont ceux qu’on ne simule pas : vers des architectures de simulation multi-paradigmes ?
A. N. RAKOTOARIVELO, J.-M. AUBERLET, R. BRÉMOND
Comportements hétérogènes de piétons et comportement émergent d’une foule
R. CHAPUT, O. BOISSIER, M. GUILLERMIN, S. HASSAS
Apprentissage adaptatif de comportements éthiques
F. SURO, J. FERBER, T. STRATULAT, F. MICHEL
Émergence de comportements collectifs basée sur l’apprentissage progressif individuel
INDEX DES AUTEURS
La simulation sociale en tant qu'outil scientifique nécessite le développement de comportements crédibles pour les agents simulant le comportement d'acteurs humains. Une façon d'améliorer la crédibilité des simulations obtenues est d'intégrer des dimensions cognitive, affective et sociales dans la prise de décision des agents. Pour autant, développer des agents avec ces dimensions peut s'avérer compliqué si l'on veut rester accessible à des chercheurs qui ne sont pas experts en informatique. L'architecture BEN (Behavior with Emotions and Norms) intègre des dimensions affectives et sociales à une prise de décisions basée sur une architecture BDI pour la réalisation de simulations sociales. Cette architecture modulaire s'appuie sur une formalisation des dimensions cognitives, affectives et sociales. BEN est implémenté dans la plateforme de modélisation et de simulation multi-agent GAMA et est ici illustrée sur un cas d'évacuation d'urgence.
L'explosion du nombre d'objets connectés, de l'informatique ubiquitaire et des interfaces humain-machine intuitives et naturelles permet une multiplication des systèmes cyber-physiques. Si les interactions avec un seul utilisateur disposent d'une littérature abondante dans le domaine des agents virtuels incarnés, la mise en place de systèmes coopératifs intégrant plusieurs utilisateurs et plusieurs agents virtuels reste difficile. Les problématiques classiques, telles que la gestion des tours de paroles par exemple, doivent être adaptées au contexte multipartie. De nouvelles problématiques, triviales en contexte dyadique comme la détection du destinataire d'un énoncé, émergent également. Dans cet article, nous discutons les défis actuels posés par les communautés mixtes agents-humains tant au niveau des agents que du système multi-agent dans son ensemble.
Cet article porte sur l'écart entre les préférences individuels des individus et leurs conséquences au niveau collectif. Le modèle de ségrégation de Sakoda-Schelling est représentatif de cette problématique ; un critère de discrimination est utilisé pour décider si une personne "insatisfaite" quittera ou non sa place ; sur la base du ratio de personnes " acceptables " autour d'un individu, des simulations simples montrent que même les agents tolérants finissent par être agrégés spatialement bien au-delà de l'exigence locale de leur niveau de tolérance. Nous utilisons ici un critère du second ordre pour inciter les individus à quitter leur place. Cet article fournit des éléments de réponse à la question : un tel critère contribue-t-il à réduire l'écart entre les micro-motivations et leur macro-conséquence?
Cet article présente un modèle de simulation multiagent à deux niveaux d'autoconsommation collective de l'énergie. Le premier niveau de ce modèle est une simulation multi-agent de l'activité humaine couplée à une simulation thermique du bâtiment qui permet d'obtenir la consommation électrique d'un foyer. Le second niveau est une modélisation d'un groupement de foyers pratiquant l'autoconsommation collective d'énergie. Nous présentons une formalisation de cette notion de groupement ainsi que différentes organisations pour échanger de l'énergie. Nous étudions ensuite ces différentes organisations et montrons leur fort impact sur la répartition de l'énergie lorsque la production est faible face à la consommation.
Avec les technologies IoT, la domotique s'oriente vers la maison intelligente. Les utilisateurs ont ainsi accès à des services à valeur ajoutée offrant un accès intégré aux dispositifs déployés au sein de la maison. Outre le fait que ces applications sont centrées sur l'utilisateur, la coordination décentralisée des décisions et la flexibilité sont des défis importants. L'utilisation d'une approche multi-agent permet de relever ces défis. Cependant, l'intégration d'une telle approche avec les solutions de l'IoT et de la gestion de contexte n'est pas un problème facile. Nous présentons une approche pour cette intégration dans un système multi-agent afin que les agents puissent adapter les services centrés sur l'utilisateur à l'évolution du contexte et des dispositifs déployés. Nous présentons la manière dont nous avons intégré ces technologies dans une architecture multi-agent qui a été conçue pour développer des services à valeur ajoutée qui adaptent leur fonctionnement à l'environnement.
La société des ingénieurs de l'automobile a identifié 5 niveaux de conduite autonome dont le niveau 3 appelé "l'automatisation conditionnée" où le conducteur doit être capable de reprendre le volant en cas de nécessité. Plusieurs études en Sciences Humaines et Sociales (SHS) ont souligné l'existence d'un laps de temps important nécessaire pour la reprise du contrôle. Ce laps dépend de l'état mental, physique et émotionnel du conducteur ainsi que du contexte de conduite. L'objectif des recherches menées en collaboration avec des chercheurs en SHS vise à la mise en place d'un système adapté à chaque conducteur facilitant la reprise de contrôle. Cet article présente une première étape de ce travail qui correspond à la conception d'un système multi-agent pour superviser la conduite autonome et détecter des situations où la reprise est nécessaire.
Dans certains systèmes multi-agents, en particulier des systèmes ouverts et distribués, la coopération peut nécessiter au préalable d'observer et évaluer le comportement des autres. Pour ce faire, plusieurs techniques de reconnaissance d'objectifs et de buts ont déjà été présentées dans la littérature. Nous introduisons ici le concept de gestion de l'information, permettant à l'agent autonome artificiel de mesurer et connaître la quantité d'information donnée à un observateur pour en tenir compte dans sa prise de décisions, et montrons comment cela peut impacter ses interactions sociales. Un ensemble d'expérimentations employant des agents BDI illustre enfin la sensibilité de ces interactions sociales aux stratégies de gestion de l'information utilisées.
Dans cet article, nous nous plaçons dans des environnements de systèmes complexes, imprévisibles et dynamiques pour lesquels nous avons pour objectif de montrer que les systèmes multi-agents adaptatifs sont une solution pertinente à leur apprentissage. Nous utilisons une approche d'apprentissage locale inspirée du constructivisme : l'auto-apprentissage de contextes par systèmes multi-agents adaptatifs. Nous cherchons à introduire des rétroactions endogènes comme moyen d'améliorer en interne le processus d'apprentissage en détectant et en résolvant les imprécisions entre les connaissances apprises. Nous proposons pour cela 3 stratégies de résolution des imprécisions d'apprentissage qui sont : une résolution réactive, un apprentissage proactif et un auto-apprentissage. Dans cet article, nous évaluons les performances de l'apprentissage proactif. Nous montrons que l'ajout de rétroactions endogènes facilité par l'auto-observation permet d'accélérer et généraliser l'apprentissage, de choisir intelligemment les données d'apprentissage et d'augmenter les performances sur les prédictions.
Cet article étudie l'applicabilité des techniques d'optimisation sous contraintes distribuée (DCOP) dans le cadre des réseaux radios hétérogènes (HetNets). Nous nous intéressons plus particulièrement au problème de l'association des terminaux utilisateurs aux stations de base, dont l'objectif est de déterminer quel utilisateur (e.g. téléphone mobile) est associé à quelle station de base pour créer un canal de communication. Toutes les stations ne garantissent pas les mêmes qualités de service et d'expérience aux utilisateurs, et la qualité de l'allocation finale (e.g. le débit total obtenu) est un critère à maximiser. Nous présentons ici un modèle DCOP de ce problème d'association, qui se base sur une gentification des stations de base se coordonnant pour obtenir une allocation efficace. Nous évaluons les performances d'algorithmes légers (MGM, MGM-2, DSA) sur un environnement simulé réaliste. Leurs performances sont comparées à celles d'une solution optimale, ainsi qu'à celle de la politique d'association actuellement utilisée dans ces réseaux, à savoir maxSINR.
Parmi les méthodes de modélisation/simulation, les systèmes multi-agents présentent un intérêt particulier pour simuler les systèmes complexes. Lorsque la taille des modèles croît, le recours aux systèmes multi-agents parallèles est nécessaire mais pose de nombreux problèmes. Dans cet article, nous nous intéressons à l'impact de la synchronisation sur la définition des modèles et leur exécution. Nous mettons en évidence des problématiques de synchronisation à travers des instances de modèles puis nous analysons expérimentalement l'impact des politiques de synchronisation sur des exécutions de grande taille.
La simulation multi-agents, outil privilégié pour l'étude des systèmes complexes, s'est orientée récemment vers deux questions de recherche : la distribution des simulations à large échelle et la modélisation multi-niveaux. Nous souhaitons proposer ici une troisième voie complémentaire : identifier les éléments d'un modèle qui peuvent n'être pas simulés par des agents (et par quoi les remplacer). Cette approche encore prospective, en contribuant paradoxalement à attaquer des problèmes difficiles dans la modélisation de systèmes complexes, est aussi un prétexte à s'ouvrir à d'autres disciplines dont les apports aux SMA pourraient s'avérer particulièrement féconds.
Dans cet article, nous proposons de simuler une foule unidirectionnelle composée de piétons aux comportements hétérogènes, et se déplaçant dans un couloir. Sous certaines conditions, nous montrons que les piétons adaptent leurs interactions avec leurs voisins, ce qui fait émerger un comportement de foule particulier : le phénomène de stop-andgo, phénomène très connu en trafic routier. Pour cela, nous avons utilisé un modèle à base d'agents pour la simulation de piétons, appelé ORCA (Optimal Reciprocal Collision Avoidance), et un modèle de file d'attente. Comme la plupart des modèles de simulation piétons, les agents du modèle ORCA utilisent tous le même raisonnement pour se déplacer, raisonnement qui repose sur le concept d'évitement de collisions. Nous avons modifié le modèle ORCA en introduisant un autre comportement de déplacement, le suivi, permettant ainsi de produire des comportements hétérogènes. En effet, un piéton peut avoir plusieurs objectifs dans son déplacement, éviter les autres, rester en groupe mais également en fonction du contexte suivre quelqu'un. Nous nous sommes concentrés sur les comportements d'évitement et de suivi. Dans certaines situations, un piéton détermine ses déplacements en fonction de ses voisins mais également par rapport à celui du piéton qui le précède. Ainsi nous avons testé plusieurs combinaisons entre comportements d'évitement et de comportements de suivi. Nous avons vérifié que nos modèles sont cohérents avec les propriétés d'une foule en utilisant le diagramme fondamental qui décrit la relation entre la densité et la vitesse moyenne d'un flux. Nos données ont été comparées entre elles, mais aussi avec des travaux antérieurs. L'un des modèles testés permet de faire émerger le phénomène de stop-and-go.
L'utilisation croissante d'algorithmes d'Intelligence Artificielle (IA) dans des applications impactant des humains requiert de doter ces systèmes d'un comportement pouvant être jugé éthique selon des valeurs humaines. Bien que plusieurs approches existent, la question de l'adaptation au contexte, aux préférences et principes éthiques des utilisateurs, reste posée. Nous proposons de traiter cette question par l'Apprentissage par Renforcement Multi-Agent de tels comportements dans des situations différentes. Nous utilisons des tables de Q-Valeurs et des Cartes Auto-Organisatrices Dynamiques pour permettre l'apprentissage adaptatif de la représentation de l'état de l'environnement, ainsi que des fonctions de récompense pour guider l'éthique du comportement. Cette proposition est évaluée sur un simulateur de répartition d'énergie dans des Smart Grids que nous avons développé. Plusieurs fonctions de récompense visant à déclencher des comportements éthiques sont évaluées. Les résultats montrent la capacité de s'adapter à différentes conditions. En sus des contributions sur le plan de l'adaptation éthique, nous comparons notre modèle à d'autres approches d'apprentissage et montrons de meilleures performances par rapport à une approche d'Apprentissage Profond basée sur le modèle Actor-Critic.
Dans la perspective d'un développement ouvert et continu il est crucial qu'un comportement final souhaité à un instant donné puisse être un élément pour la création future de comportements plus complexes, dont le but ne peut être anticipé. L'acquisition de nouveaux comportements est déclenchée par l'apparition de nouveaux besoins et problèmes résultants de l'interaction avec l'environnement, mais aussi à travers l'interaction avec d'autres agents. Dans cet article nous soumettons l'architecture développementale MIND à un problème de coordination multiagents. A partir de comportements établis individuellement, nous ferons apprendre à un groupe d'agents, au moyen d'un curriculum établi par un instructeur humain, un comportement collectif, ainsi que l'utilisation alternante de comportements individuels et collectifs afin d'accomplir un but commun.