Classification non supervisée incrémentale de données relationnelles
Cet article présente deux nouveaux algorithmes flous
incrémentaux de classification non supervisée basés sur
les médoides. Ces algorithmes traitent des flux continus
ou bien de grands volumes de données qui ne peuvent
pas être contenus en mémoire vive et qui ne sont pas
nécessairement représentés par des valeurs numériques.
Nous comparons ces deux nouvelles méthodes à des algorithmes
flous issus de la littérature sur des jeux de
données artificielles et réelles. Les résultats montrent que
nos méthodes obtiennent des résultats comparables voire
meilleurs par rapport à l'existant tout en ajoutant la possibilit
é de traiter des jeux de données relationnelles, ce qui
est crucial dans nombre d'applications réelles.
This paper presents two new fuzzy medoid-based clustering
algorithms for relational datasets. These algorithms
are tailored to work with continuous data streams,
or large datasets that do not fit in main memory and
where data are not necessarily represented by numerical
values. Our new algorithms are compared to state-of-theart
fuzzy clustering algorithms on artificial and real datasets.
Experiments show that our new approaches perform
closely if not better than existing clustering algorithms
while adding the capacity to handle relational datasets,
which is crucial in many real world applications.