Lexicographic refinements in possibilistic Markov decision processes : The finite horizon case


La théorie de décision possibiliste a été proposée il y a vingt ans et depuis lors elle a eu plusieurs extensions. En raison du manque de pouvoir décisionnel de cette théorie, plusieurs raffinements ont ensuite été proposés. Les raffinements lexicographiques sont particulièrement attrayants car ils permettent de bénéficier de l'arrière-plan de l'utilité espérée, tout en restant “qualitatif”. Cet article vise à étendre ces critères lexicographiques aux problèmes séquentiels c'est-à-dire aux processus décisionnels de Markov possibilistes. Il présente deux critères qui raffinent les utilités qualitatives possibilistes et fournit un algorithme d'induction en arrière pour le calcul des stratégies optimales lexicographiques, lorsque l'horizon est fini.