Proportions analogiques : cr´eativit´e et fouille de donn´ees


Une proportion analogique est un énoncé de la forme A est à B comme C est `a D, o`u A,B,C,D sont des vecteurs de valeurs booléennes ou numériques. Ce type d'énoncé exprime que A diffère de B comme C diffère de D (et vice-versa). Le fait que des proportions analogiques soient satisfaites pour certaines variables permet d'extrapoler qu'une telle relation tient pour d'autres et ainsi de prédire des valeurs manquantes. Une autre propriété remarquable est que, étant donnés trois vecteurs A,B,C, il en existe au plus un D, généralement différent des trois premiers qui forme avec eux une proportion analogique. Cette propriété est à la base de capacités créatives qui sont discutées ici. Elles peuvent être aussi intêressantes pour des systèmes de recommandation, et aider `à fournir des explications. Par ailleurs, si des proportions analogiques tiennent sur un ensemble de données, cela constitue une information qui mérite que l'on s'y intéresse. Il est donc naturel de chercher `a extraire de telles proportions, comme on chercherait des règles d'association. Nous proposons un algorithme qui extrait des proportions analogiques.