Predicting re-employment: machine learning versus assessments by unemployed workers and by their caseworkers
Gerard van den Berg, Max Kunaschk, Julia Lang, Gesine Stephan, Arne Uhlendorff
Dans cet article, les auteurs analysent des données uniques sur trois sources d'information concernant la probabilité de retrouver un emploi dans les six mois (RE6), pour les mêmes individus échantillonnés à partir du flux entrant dans le chômage. Premièrement, ils ont été interrogés sur leur perception de la probabilité de RE6. Deuxièmement, leurs conseillers ont révélé s'ils s'attendaient à un RE6. Troisièmement, des méthodes d'apprentissage automatique de type forêt aléatoire ont été entraînées sur des données administratives concernant l'ensemble du flux entrant, afin de prédire le RE6 individuel.
Les auteurs comparent les performances prédictives de ces mesures et examinent comment des combinaisons améliorent cette performance. Ils montrent que les évaluations auto-déclarées (et dans une moindre mesure celles des conseillers) contiennent parfois des informations non capturées par l'algorithme d'apprentissage automatique.