Calcul distribué de politiques d'exploration pour une flotte de robots mobiles


Ce papier présente une architecture multirobots permettant une allocation automatique de plusieurs objectifs sur une flotte de robots. Le challenge consiste à rendre des robots autonomes pour réaliser coopérativement leur mission sans qu'un plan soit prédéfini. Cette architecture, appelée PRDC, est basée sur 4 modules (Perception, Représentation, Délibération et Contrôle). Nous nous intéressons plus particulièrement au module de délibération en considérant le problème des voyageurs de commerce coopératifs dans un environnement incertain. L'objectif des robots est alors de visiter un ensemble de points d'intérêt représentés dans une carte topologique stochastique (Road-Map). Le processus proposé pour la construction des politiques collaboratives est distribué. Chaque robot calcule ses politiques individuelles possibles de façon à négocier collectivement l'allocation des points d'intérêt entre les membres de la flotte. Enfin, l'approche est évaluée via un important nombre de simulations. This paper presents a multi-robot architecture which permits to automatically allocate a set of exploration goals for a fleet of mobile robots. The challenge is to design autonomous robots able to cooperatively perform missions without a predefined plan. The architecture, called PRDC, is based on 4 modules (Perception, Representation, Deliberation and Control). The paper focuses on the deliberative module and addresses the cooperative stochastic salesmen problem where the goal is to visit a set of points of interest. A stochastic Road-Map is defined as a topological representation of unstructured environment with uncertainty on the path achievement. Decision making uses a distributed computation of individual Markov Decision Process in order to allocate the set of points of interest between them. Finally, a large number of simulations permit to evaluate the proposed approach.