Un Opérateur Skyline Flexible pour l'Interrogation de Bases de Données : Premières explorations


Les requêtes skyline représentent un paradigme très populaire et puissant pour extraire des objets ou points d'un ensemble de données multidimensionnelles. Elles s'appuient sur le principe de dominance de Pareto pour identifier l'ensemble des objets qui ne sont dominés par aucun autre objet de la même relation. Dans ce contexte, deux problèmes peuvent surgir : (i) un nombre important de réponses qui est généralement peu informatif du point de vue de l'utilisateur, (ii) un nombre insuffisant de réponses. Dans cet article, nous proposons une approche permettant un raffinement du skyline pour traiter le problème (i). Elle est basée sur une relation de dominance fondée sur des quantificateurs linguistiques. L'approche permet de sélectionner les objets les plus intéressants parmi ceux retournés par le skyline. Skyline queries are a popular and powerful paradigm for extracting interesting objects from a ddimensional dataset. They rely on Pareto dominance principle to identify the set of objects which are not dominated by any other object from the dataset. In this context, two main problems may be faced : (i) a large number of skyline objects which is less informative for the users ; and (ii) a small number of returned objects which could be also insufficient. In this paper, we tackle the first problem and propose an approach to deal with it. The proposed approach aims at refining the skyline in order to select the best of its elements. A new definition of dominance relationship based on fuzzy quantifiers, is introduced. The approach is intended to be integrated in flexible querying systems of d-dimensional databases.