Imputation crédibiliste pour la prédiction de charge interne de joueurs de football


L'objectif de cet article est de comparer trois approches de gestion des données manquantes dans un contexte de classification avec étiquettes séquentielles à pas de temps variable. Les données concernent le suivi longitudinal de vingt-sept joueurs professionnels de football en termes de planning d'entraînement et de charge interne ressentie. Une approche sans imputation utilise l'ancienneté des données, les deux autres approches sont basées sur des modèles d'incertitude lors de l'imputation des données manquantes. L'Evidential K-Nearest Neighbors (EKNN) est utilisé pour la prédiction de charge interne en prenant en compte l'incertitude des étiquettes, et l'approche sans incertitude avec K-Nearest Neighbors standard. Les résultats montrent une certaine amélioration des prédictions pour les modèles utilisant l'incertitude des données imputées.