Adaptation dynamique d'un drone aux perturbations environnementales par apprentissage
Le démonstrateur présenté introduit un cas d'étude concret d'apprentissage par système multi-agent dans un environnent simulé. Le coeur de ce travail est l'enrichissement d'un apprentissage par démonstration à l'aide d'un mécanisme d'apprentissage autodidacte. Ce mécanisme permet à l'agent apprenant de dépasser les limites introduites par le processus de démonstration en lui permettant d'adapter son comportement pour faire face à des situations imprévues. Cet apprentissage concerne une tâche robotique : l'apprentissage d'un suivi de trajectoire pour drone aérien. Le mécanisme d'apprentissage autodidacte apporte de la robustesse à l'apprentissage.