Classification non supervisée incrémentale de données relationnelles


Cet article présente deux nouveaux algorithmes flous incrémentaux de classification non supervisée basés sur les médoides. Ces algorithmes traitent des flux continus ou bien de grands volumes de données qui ne peuvent pas être contenus en mémoire vive et qui ne sont pas nécessairement représentés par des valeurs numériques. Nous comparons ces deux nouvelles méthodes à des algorithmes flous issus de la littérature sur des jeux de données artificielles et réelles. Les résultats montrent que nos méthodes obtiennent des résultats comparables voire meilleurs par rapport à l'existant tout en ajoutant la possibilit é de traiter des jeux de données relationnelles, ce qui est crucial dans nombre d'applications réelles. This paper presents two new fuzzy medoid-based clustering algorithms for relational datasets. These algorithms are tailored to work with continuous data streams, or large datasets that do not fit in main memory and where data are not necessarily represented by numerical values. Our new algorithms are compared to state-of-theart fuzzy clustering algorithms on artificial and real datasets. Experiments show that our new approaches perform closely if not better than existing clustering algorithms while adding the capacity to handle relational datasets, which is crucial in many real world applications.