Étalonnage évidentiel actif de classifieurs SVM


Les méthodes évidentielles d' étalonnage de classifieurs binaires apportent une amélioration par rapport aux méthodes probabilistes, en représentant explicitement l'incertitude d'étalonnage induite par la quantité de données (étiquetées) d'apprentissage. Cette incertitude justifiée mais indésirable peut être réduite en ajoutant des données d'apprentissage, qui sont généralement coûteuses. D'où la nécessité de stratégies qui, étant donné un réservoir de données non étiquetées, sélectionneront des données intéressantes à étiqueter, c'est-à-dire celles induisant une baisse d'incertitude supérieure à la sélection aléatoire. Deux stratégies de ce type, inspirées de l'échantillonnage par incertitude en apprentissage actif, sont considérées dans cet article et appliquées à un ensemble de classifieurs SVM sur des jeux de données de classification binaire classiques. Les résultats expérimentaux montrent l'intérêt de l'approche vis-à-vis de la réduction de l'incertitude d'étalonnage, mais aussi vis-à-vis de l'amélioration des performances de classification.