Système de liage de données manquantes basé sur la théorie des ensembles approximatifs pour le web sémantique


Résoudre l'hétérogénéité sémantique entre différentes sources de données est un problème central dans l'intégration et le partage d'informations dans le web des données ouvertes. Une solution peut être trouvée dans les travaux en rapport avec le liage des données et l'alignement des ontologies qui expriment la sémantique de la terminologie utilisée dans les différents jeux de données. Dans cet article, nous nous sommes intéressées aux données décrites par des vocabulaires hétérogènes qui proviennent d'une conceptualisation différente des ontologies. Nous permettons, par l'approche d'alignement proposé pour lier des données du web, de prendre en compte l'aspect incomplet de l'information. Pour cela, un système d'alignement d'instances a été réalisé en se basant sur la théorie des ensembles approximatifs. La comparaison des données se fait à travers leurs attributs même si certaines propriétés ne sont pas renseignées. Ce travail vient renforcer les travaux qui considèrent que la primitive owl:sameAs, dont la sémantique permet d'indiquer que deux objets sont identiques et qu'en termes d'inférence leurs propriétés sont substituables, n'est pas utilisé à bon escient dans le web des données ouvertes.