Un concept de solutions avec un biais d’exploration pour les jeux de coalitions stochastiques répétés


Classiquement, en formation de coalitions, les agents connaissent à l’avance les utilités déterministes qu’ils vont obtenir des coalitions. Relâcher ces deux hypothèses (déterminisme et connaissance a priori) nous place dans un cadre de jeux de coalitions stochastiques répétés. Les agents doivent décider à chaque pas de temps quelle coalition former sur la base d’informations limitées. Ils obtiennent alors des observations qui permettent de mettre à jour leurs connaissances. Nous proposons un concept de solutions qui intègre explicitement une notion d’exploration pour permettre aux agents de parfois former des coalitions ayant une faible utilité mais qui seraient intéressantes à former pour obtenir plus d’informations. Nous comparons ce concept à une approche gloutonne et mettons en lumière son efficacité en fonction de la structuration des utilités réelles, inconnues des agents