Évitement de collision dans des espaces aériens denses: des défis pour l’apprentissage par renforcement multi-agent
Face à l’encombrement grandissant de l’espace aérien, il est nécessaire de développer des systèmes d’évitement de collision robustes à un grand nombre d’aéronefs. Le système d’évitement de collision ACAS-X est une solution de nouvelle génération améliorant la résolution de conflits et limitant les actions inutiles par rapport aux méthodes traditionnelles. Cependant, cette solution présente certaines limitations, notamment la restriction à des scénarios avec un seul avion intrus, et la dépendance à des espaces d’état et d’action fortement discrétisés. Dans cet article, nous montrons que l’extension naïve du système ACAS-X à des scénarios multi-intrus conduit à des résultats sous-optimaux, voire dangereux. Pour y remédier, nous formalisons le problème multi-agent d’évitement de collision et proposons l’utilisation de l’apprentissage par renforcement multi-agent profond (MARL) afin d’obtenir des manœuvres optimales dans des contextes complexes. Nous identifions ensuite les principaux défis et soulevons de nouvelles questions de recherche.