Génération efficace de résumés linguistiques estimés


Résumer des données est un problème qui a donné lieu à de nombreux travaux dans la communauté du soft computing. Il s'agit de générer des propositions décrivant linguistiquement les propriétés observées dans un jeu de données. Cet article s'intéresse à l'extraction efficace de tels résumés dans le cas où les données sont stockées dans une base de données relationnelle. Il propose une approche qui exploite les statistiques maintenues par le SGBD, et montre que des résumés fiables peuvent être estimés sans aucun accès aux données.