Évaluation de la crédibilité sociale des agents génératifs : incitations, croyances et coordination


Les progrès récents des grands modèles de langues (LLMs) ont permis le développement d’agents génératifs (AGs) capables de prendre des décisions et d’interagir. Cet article examine si ces agents sont capables de présenter un comportement socialement crédible. Nous évaluons 5 LLMs dans 3 jeux canoniques. Nos résultats montrent que seul Mistral-Small s’adapte à des incitations variables. Bien que certains AGs soient capables d’anticiper le comportement de leur interlocuteur, peu réussissent à intégrer ces prédictions dans des décisions stratégiques cohérentes. Ces lacunes comportementales expliquent pourquoi la coordination reste particulièrement difficile : la plupart des AGs ont du mal à s’aligner avec les autres, même lorsque la communication est possible.