La coordination est considérée comme un problème crucial pour la communauté SMA. Dans ce papier, nous nous focalisons sur l'une des approches existantes : les jeux stochastiques à somme générale, pour faire interagir des agents autonomes. L'équilibre de Nash a été choisi comme moyen d'obtention de la politique jointe. La validation a été réalisée sur un exemple illustratif et l'évaluation a été effectuée en comparant avec un modèle centralisé (MMDP). Les résultats préliminaires montrent l'intérêt du modèle, malgré une légère dégradation de la qualité de la solution en fonction de la taille de l'espace d'états. Coordination is seen as a crucial issue for the MAS. In this paper, we focus on one of the existing approaches, the stochastic games with general-sum, to make the autonomous agents interact. The Nash equilibrium has been chosen as a mean to obtain the global policy. The validation is conducted on a typical example and the evaluation is done by comparison with a centralized model (MMDP). Preliminary results show the interest of the model, although a slight deterioration in the quality of the solution when the size of the state space increases.
Ce papier présente une architecture multirobots permettant une allocation automatique de plusieurs objectifs sur une flotte de robots. Le challenge consiste à rendre des robots autonomes pour réaliser coopérativement leur mission sans qu'un plan soit prédéfini. Cette architecture, appelée PRDC, est basée sur 4 modules (Perception, Représentation, Délibération et Contrôle). Nous nous intéressons plus particulièrement au module de délibération en considérant le problème des voyageurs de commerce coopératifs dans un environnement incertain. L'objectif des robots est alors de visiter un ensemble de points d'intérêt représentés dans une carte topologique stochastique (Road-Map). Le processus proposé pour la construction des politiques collaboratives est distribué. Chaque robot calcule ses politiques individuelles possibles de façon à négocier collectivement l'allocation des points d'intérêt entre les membres de la flotte. Enfin, l'approche est évaluée via un important nombre de simulations. This paper presents a multi-robot architecture which permits to automatically allocate a set of exploration goals for a fleet of mobile robots. The challenge is to design autonomous robots able to cooperatively perform missions without a predefined plan. The architecture, called PRDC, is based on 4 modules (Perception, Representation, Deliberation and Control). The paper focuses on the deliberative module and addresses the cooperative stochastic salesmen problem where the goal is to visit a set of points of interest. A stochastic Road-Map is defined as a topological representation of unstructured environment with uncertainty on the path achievement. Decision making uses a distributed computation of individual Markov Decision Process in order to allocate the set of points of interest between them. Finally, a large number of simulations permit to evaluate the proposed approach.
Cet article introduit DyLIM 1, un modèle pour la représentation de problèmes de type DECPOMDP. Ce modèle, qui permet une représentation basée interactions de ce type de problèmes, relâche l'hypothèse de dépendances fortes et permanentes des approches existantes et considère qu'un agent interagit seulement quelquefois, avec quelques agents, sans aucune structure spécifique. Cela nous permet de représenter le problème multiagent comme un ensemble de problèmes individuels (parfois interdépendants) et donc de casser la complexité. Nous introduisons deux algorithmes de résolution différents pour ce modèle et nous évaluons ceux-ci sur un ensemble de benchmarks classiques dans le domaine. Nous montrons ainsi les bénéfices de notre approche et sa capacité à calculer des politiques quasi-optimales pour des problèmes impliquant beaucoup d'agents.