Un modèle de mémoire pour l'apprentissage de communication dans un SMA [présentation courte


L'apprentissage de comportement dans un contexte multi-agent est un problème difficile, en particulier parce que la prise en compte de la communication avec les autres agents requiert la mémorisation d'informations spécifiques. Dans cet article, nous présentons les modèles de mémoire existants et nous montrons qu'ils ne permettent pas de gérer l'apprentissage de communication. Nous proposons ensuite un modèle de mémoire pour l'apprentissage par renforcement des messages de commande (request) et de contrôle (query). Ce modèle permet de gérer l'asynchronisme du système et les attentes de réponses aux messages. Enfin, nous présentons une évaluation de ce modèle sur un exemple simple et nous montrons qu'il construit une politique en un temps raisonnable et avec un espace mémoire réduit. Learning in a multi-agent context is a difficult task, especially since the communication with other agents require additional information to be stored and used in the learning process. In this paper, we propose a model of agent memory for command and control in a multi-agent context. We first show why the existing memory models are not sufficient to support automated learning of command and control in a multiagent context. Then, we describe our model for storing messages and answers. Finally we show on an example that this model allows faster learning and better convergence.