L'utilisation croissante d'algorithmes d'Intelligence Artificielle (IA) dans des applications impactant des humains requiert de doter ces systèmes d'un comportement pouvant être jugé éthique selon des valeurs humaines. Bien que plusieurs approches existent, la question de l'adaptation au contexte, aux préférences et principes éthiques des utilisateurs, reste posée. Nous proposons de traiter cette question par l'Apprentissage par Renforcement Multi-Agent de tels comportements dans des situations différentes. Nous utilisons des tables de Q-Valeurs et des Cartes Auto-Organisatrices Dynamiques pour permettre l'apprentissage adaptatif de la représentation de l'état de l'environnement, ainsi que des fonctions de récompense pour guider l'éthique du comportement. Cette proposition est évaluée sur un simulateur de répartition d'énergie dans des Smart Grids que nous avons développé. Plusieurs fonctions de récompense visant à déclencher des comportements éthiques sont évaluées. Les résultats montrent la capacité de s'adapter à différentes conditions. En sus des contributions sur le plan de l'adaptation éthique, nous comparons notre modèle à d'autres approches d'apprentissage et montrons de meilleures performances par rapport à une approche d'Apprentissage Profond basée sur le modèle Actor-Critic.
Dans un futur proche, la disponibilité croissante des données imposera aux décideurs politiques de modifier régulièrement les politiques urbaines afin d'intégrer l'évolution des comportements et les retours utilisateurs. Dans ce papier, nous proposons une architecture multi-agent générique permettant de concevoir et de modéliser des politiques urbaines afin d'en éprouver la pertinence en la déployant sur un environnement spécifique. Ces environnements sont conçus en exploitant des données provenant de n'importe quelle ville disposant de données ouvertes et communautaires (Open Street Map). Deux modèles multi-agents sont couplés dans une boucle dynamique micro-macro et peuvent être modifiés à la fois par des techniques d'apprentissage par renforcement ainsi que par l'intégration du retour des décideurs politiques. Nous proposons une formalisation permettant de représenter les politiques urbaines pour initier une co-construction entre le décideur politique et notre système. Une expérimentation sur la régulation de la tarification d'emplacements de stationnement en zone urbaine permet de justifier l'usage de notre architecture pour concevoir des politiques urbaines pertinentes.
Pour garantir l'équilibre entre la production et la consommation électrique sur l'ensemble du réseau, les efforts se portent surtout sur la gestion de la production. L'effacement diffus propose de maîtriser la consommation et satisfait les contraintes apportées par les énergies renouvelables et la décentralisation de la production. La problématique soulevée dans ce contexte consiste à faire en sorte qu'un ensemble d'agents, représentant les nœuds du réseau électrique, puissent d'une part anticiper leurs demandes et d'autre part ajuster leur contribution à l'effort collectif d'effacement de la consommation électrique. En choisissant une approche ascendante au problème de l'effacement diffus nous proposons un algorithme décentralisé fondé sur les algorithmes de diffusion épidémique. Ces algorithmes offrent à la fois les propriétés de robustesse et d'évolutivité, tout en garantissant la fiabilité nécessaire au fonctionnement d'un réseau électrique à grande échelle. Dans cet article, nous présentons notre modèle et discutons les premiers résultats encourageants que nous avons obtenus sur des données simulées, puis nous proposons des pistes d'amélioration possibles.
La problématique de cet article s'inscrit dans le domaine de la résilience des systèmes complexes. Etant donné un système d'information réparti dont les éléments sont collectés par un grand nombre d'agents dont certains sont dissonants, c'est-à-dire produisent ou communiquent des informations incorrectes, il s'agit d'étudier la mise en place d'une stratégie de communication permettant de diminuer l'impact de la dissonance. Pour ce faire, chaque agent maintient un réseau de confiance de type TrustNet et un système d'informations locales, construits de manière originale à partir de la confrontation d'informations directes (collectées par l'agent) et d'informations indirectes (obtenues à partir des agents rencontrés). Ces outils permettent à l'agent d'améliorer son système de communication en adoptant une stratégie spécifique adaptée à la dissonance. Nous montrons ce que notre méthodologie apporte à une application de cartographie collaborative où un système multiagents représente un essaim de robots explorant une zone en vue d'en détecter les dangers. This article presents a study on how to elaborate a communication strategy to ensure the coherence of an information system distributed among agents. We consider the case of a system where information are collected by a multiagent system with the hypothesis that some agents of the system are dissonant, i.e. can produce or communicate incorrect information. To limit the impact of this potential dissonance, agents will maintain a TrustNet constructed from agents they have met and information they have received. We apply our methodology to a mapping example : a swarm of potentially dissonant robots have to collaboratively map a zone affected by dangers. Robots can collect information directly on the ground and exchange their map with other agents.
La question abordée dans cet article concerne l'auto-organisation, dans un système multiagents, des dynamiques informationnelle et comportementale, et de leur coordination décentralisée et dynamique, en vue d'obtenir un comportement collectif cohérent. Nous étudions cette problématique à travers l'exemple d'un système multi-agents (SMA) qui collecte des informations provenant de sources distribuées dans lequel certains agents peuvent être défectueux (volontairement ou non). Nous proposons une approche auto-organisationnelle, fondée sur une vision systémique qui consiste à considérer le SMA à travers son couplage structurel à son environnement physique et informationnel. On définit ainsi 3 dynamiques : informationnelle, comportementale et la dynamique de leur couplage à travers une coordination décentralisée. Ces dynamiques sont induites par les comportements des agents et leurs interactions, combinant des mécanismes de confiance et l'application de règles de comportements locales. This paper addresses the issue of the self organization of a multi-agents system through the coupling of three dynamics : informational dynamics, behavioral dynamics and their coordination through a retro-active coupling. As an illustrative example, we consider the problem of maintaining information coherence and its robustness in a multi-agent system (MAS) that collectively gathers information from distributed sources and where some sources may be defective (deliberately or not). In this context, we propose a self-organizational approach, based on a systemic view in which we consider a structural coupling between two levels : direct information gathering at the spatial level, and communication at the social level. The local behavior rules are composed of three rule categories : rules of deployment, rules of communication, and rules of retro-action between communication and deployment. The combination of these behavior rules is then experimented in our simulations to see the emergence of roles in the system.
Cet article présente un modèle multiagent de trafic coopératif et son implémentation, vue comme une extension du simulateur de trafic MovSim. La dynamique physique des véhicules est décrite avec le point de vue du domaine de la théorie du trafic en proposant un modèle microscopique, multi-anticipatif et bilatéral de suivi de véhicules. Ce modèle est enrichi par des paradigmes agent qui influencent le comportement des véhicules grâce aux mécanismes de perception, de communication et au concept de confiance. Les résultats en simulation, utilisant des données réelles, mettent en valeur l'impact positif des véhicules connectés sur l'homogénéisation du flux de trafic, même en présence de capteurs défaillants. Le travail présenté se positionne aussi comme un outil d'aide à la décision pour le déploiement futur de véhicules coopératifs et de leur infrastructure, et pour la conception de stratégies de contrôle de tels systèmes. The paper presents an agent-based cooperative traffic model implemented as an extension of the Multi-model Open-source Vehicular-traffic SIMulator (MovSim). Connected vehicles dynamics are described from a traffic flow theory standpoint using a bilateral multi-anticipative microscopic model. Then, agent-based concepts allow to influence vehicles dynamics through perception and trust-based mechanisms. Sensors failures and information reliability are well captured by trust concepts. This framework is implemented into the simulator and tested with real data. Simulation results shed light on how connected vehicles improve traffic flow homogenization and ensure safety even with unreliable sensors. The proposed tool presents the potential to act as a decision support tool within the future deployment of connected vehicles and the design of cooperative traffic management strategies.
Le paradigme constructiviste de l'apprentissage en intelligence artificielle (IA) se développe largement à travers des concepts tels que l'IA incarnée, l'IA énactive ou la Robotique développementale. L'objectif commun à ces approches est de créer des agents autonomes car dotés d'une capacité d'adaptation à leur environnement et même d'apprentissage, à l'image des organismes biologiques. Un vaste champ d'application inclut tous les systèmes en interaction avec un environnement complexe, dont les objectifs sont variés et non prédéfinis. Suivant ce positionnement, nous nous intéressons ici au problème de l'intelligence ambiante. Nous proposons un modèle décentralisé d'apprentissage constructiviste pour un système d'AmI basé sur une architecture multi-agent. Avec ce travail nous abordons notamment le problème de l'amorçage de l'apprentissage sensorimoteur pour des environnements réels continus sans modélisation de l'environnement à priori.