C’est un sujet sensible, qui touche à la vie privée d’une grande partie des Français : comment la CAF décide-t-elle qui contrôler ?
Depuis 2011, l’organisme chargé notamment des allocations familiales, des aides au logement, du RSA et de la prime d’activité met à disposition de ses contrôleurs un outil algorithmique qui les aide à orienter leur stratégie de contrôle, en mettant en avant des variables susceptibles de générer des « indus », c’est-à-dire des erreurs de versement, qu’il s’agisse de trop-perçus ou de montants insuffisants.
Le dispositif avait, au minimum, suscité l’interrogation, sinon la colère, de nombreuses associations, qui y voyaient une mesure s’inscrivant dans une stratégie « anti-pauvres ».
À l’heure où la solidarité à la source est, pour l’essentiel, mise en place et qu’un nouvel algorithme s’impose, l’organisme avait l’occasion de revoir sa copie.
Mais pour son directeur général, Nicolas Grivel, qui s’exprime auprès de Numerama, il n’était pas question de se passer de cet outil : « Il n’y a pas de doute sur le fait que ce modèle est efficace et très utile pour orienter une partie restreinte, mais importante, de nos contrôles, en termes de valeur ajoutée et de qualité de notre travail, grâce à la correction des écarts au juste droit. »
Exit certaines variables polémiques, et mise en place d’un comité éthique : le nouvel algorithme, baptisé DMDE 2026 (Data Mining Données Entrantes) et dont le déploiement est annoncé comme « imminent », s’accompagne d’une nouvelle approche.
« Quand tout ça est né en 2011, puis a été actualisé en 2015, cela a été fait dans un contexte différent, avec une autre stratégie, et à un moment où ces questions étaient moins sensibles. On y prêtait peut-être un peu moins d’attention, globalement. »

Un outil de la CAF renouvelé, malgré les critiques
Si le renouvellement de l’outil peut être vécu comme un échec par ses plus fervents opposants, la demande de transparence, elle, semble avoir été entendue. L’objectif affiché par la direction est de sortir de l’ère de la « boîte noire » pour aller vers une véritable pédagogie de l’algorithme.
Face aux inquiétudes de la société civile et des associations, la CAF dit avoir choisi « d’ouvrir le capot ». Cette nouvelle transparence passe par la création d’un comité d’éthique composé d’administrateurs, d’experts (juristes, sociologues) et d’associations de lutte contre la pauvreté, réuni en parallèle de la mise en place du nouvel algorithme et consulté à mesure que les retours de terrain remonteront : « Notre but n’est pas de les instrumentaliser […] mais qu’on s’apporte mutuellement de la compréhension », précise Nicolas Grivel, qui ne leur demande pas de valider le système, mais de participer à un espace délibératif.
La CAF insiste également sur un point : la machine ne décide pas seule. L’algorithme attribue un score de risque, mais ce sont les contrôleurs qui définissent leur stratégie sur le terrain, sans se contenter de suivre aveuglément la liste des scores les plus élevés. « Il y a un mix entre ce qu’apporte un ciblage statistique et des choix humains », assure le dirigeant, en rappelant que l’outil ne pilote qu’une partie des contrôles, le reste reposant sur des croisements de données automatisés avec les impôts ou France Travail.


Des changements apportés
Dans son essence, l’outil reste similaire à ses prédécesseurs : il repose sur un ensemble de variables qui pèsent plus ou moins lourd dans la détermination d’un score de risque d’indus pour chaque foyer allocataire.
« On n’est pas sur des outils très révolutionnaires d’un point de vue technologique […], c’est simplement un outil statistique qui vise à faire un miroir des risques qu’on a de trouver des indus », explique Nicolas Grivel.
Concrètement, parmi les 13,8 millions de foyers allocataires, les situations qui font grimper le score de risque sont celles où les revenus sont instables et les déclarations plus complexes. « Si on versait des prestations sociales ou familiales à des milliardaires en leur demandant de déclarer des trucs très très compliqués […], ils ressortiraient en risque », ironise Nicolas Grivel, pour répondre aux accusations de stigmatisation volontaire de la précarité.
Certaines variables utilisées dans l’ancien système ont toutefois été supprimées, afin de limiter les biais discriminatoires, directs ou indirects. « En lien avec le comité, nous avons choisi d’exclure complètement la variable sur la nationalité », précise le dirigeant, de même que « l’implantation territoriale », qui ne fait plus partie des critères de ciblage.
L’algorithme point par point
Nous avons pu examiner le code source de l’algorithme mis en ligne par la CAF, qui intervient à un moment charnière : la généralisation de la « solidarité à la source » depuis mars 2025. Avec le pré-remplissage des déclarations de ressources, sur le modèle de l’impôt sur le revenu, le risque d’erreur chute drastiquement.
Le nouvel algorithme est donc conçu « à double détente » : il a vocation à évoluer au fur et à mesure que les déclarations pré-remplies deviendront la norme. « Ce modèle va perdre sa force au moment où on le modernise », admet Nicolas Grivel, la sécurisation des données en amont rendant le contrôle a posteriori moins crucial pour la majorité des allocataires.
Concrètement, la documentation technique de la CAF présente un modèle de régression logistique composé de quatre modules qui, mis bout à bout, permettent de calculer un « score de risque » compris entre 0 et 1. Plus ce score est élevé, plus l’allocataire a de chances d’être sélectionné pour un contrôle.
A noter que le DMDE 2026 ne cible que les dossiers avec un indu d’au moins 600 euros et courant pendant au moins 6 mois.
Module 1 : les revenus avant solidarité active
Ainsi, le premier module reconstruit 24 mois d’historique de revenus pour chaque foyer et ne garde que ceux qui touchent au moins une prestation. Il convertit tous les montants en multiples du SMIC ou de la BMAF pour rendre les dossiers comparables dans le temps.
Il prend en compte :
- les revenus annuels par foyer, ramenés au SMIC puis rangés en tranches (0, <0,4 du SMIC, entre 0,4 et 0,6 du SMIC, etc.) ;
- les prestations perçues : montants moyens sur 12 mois du RSA, des allocations familiales, du complément familial, de la prime d’activité et du total des prestations, chacun découpé en petits / moyens ou gros montants ;
- la stabilité : nombre de changements RSA sur 12 mois, présence/changements d’activité non salariée, pensions alimentaires déclarées, faits administratifs (logement étudiant, volets sociaux, projet d’accompagnement RSA), tutelle morale ;
- la composition globale du foyer : présence d’au moins un enfant de 19 ans ou plus, type de foyer (couple bi‑actif, conjoint sans activité, retraité, autre), activité des enfants de plus de 16 ans (étudiant, salarié, sans activité, autre).
| Ce qui fait monter la note | Ce qui fait baisser la note |
|---|---|
| les revenus très faibles avec prestations élevées | des revenus plus stables |
| de nombreux changements de RSA | des prestations modestes |
| des activités non salariées mouvantes | peu de changements |
| des « signaux » pouvant conduire à des indus, comme la présence d’un enfant âgé de plus de 19 ans dans le foyer | foyer simple sans signaux particuliers |
Module 2 : les écarts signalements / déclarations
Ce module se focalise sur les différences entre ce que l’allocataire a signalé de lui‑même et ce qui finit dans les déclarations trimestrielles de ressources.
Il fait, sur 12 mois :
- la comparaison mensuelle entre les montants pré-fournis et les montants des signalements pour chaque personne et pour chaque foyer ;
- des moyennes d’écart par individu, puis par foyer, puis par trimestre ;
- une moyenne finale sur les 4 dernières déclarations trimestrielles.
| Ce qui fait monter la note | Ce qui fait baisser la note |
|---|---|
| des écarts répétés et importants qui diminuent les ressources sur plusieurs déclarations successives. | peu ou pas de signalements, ou des écarts minimes entre signalements et déclarations. |
Module 3 : Modèle avec pré‑remplissage
Ce module reprend la logique du Module 1, mais l’adapte au contexte où les déclarations sont pré‑remplies.
Il consiste ainsi à garder une partie des variables du Module 1 (changements RSA, montants de prestations, composition du foyer, tranches de revenus, profils d’activité), d’y ajouter la variable issue du Module 2 sur les écarts ressources enregistrées/déclarations puis à en supprimer d’autres, rendues moins utiles quand les revenus sont déjà en partie connus.
| Ce qui fait monter la note | Ce qui fait baisser la note |
|---|---|
| les mêmes profils complexes que dans le Module 1 + les écarts répétés entre signalements et déclarations. | dossiers simples, revenus lisibles, peu de prestations, peu de corrections. |
Module 4 : mélange ancien / nouveau score
Ce module ne crée pas de nouvelles variables : il orchestre la transition entre l’ancien modèle (sans pré‑remplissage) et le nouveau (avec pré-remplissage).
Pour chaque foyer et chaque mois, il calcule un ratio entre le score avant solidarité active et après.
Ainsi, la transition s’opère mécaniquement, au début, le score final est quasiment celui de l’ancien modèle, 24 mois plus tard, il est entièrement celui du nouveau.
Et pour la suite ?
Les retours terrain sur la mise en place de ce nouvel algorithme seront à nouveau présentés au comité éthique pour consultation.
D’ici là, la direction assume avoir choisi un modèle « rustique » et explicable plutôt que de passer à un traitement par IA plus opaque, pour des raisons de transparence et de réassurance après les polémiques.
La CAF « ne s’interdit pas » toutefois, de recourir à l’IA pour le contrôle à l’avenir si cela apporte une vraie valeur ajoutée.
En parallèle, elle teste déjà l’IA comme outil de soutien aux agents, pour trier et prioriser les documents, les mails et certaines réponses téléphoniques simples.
Les abonnés Numerama+ offrent les ressources nécessaires à la production d’une information de qualité et permettent à Numerama de rester gratuit.
Zéro publicité, fonctions avancées de lecture, articles résumés par l’I.A, contenus exclusifs et plus encore. Découvrez les nombreux avantages de Numerama+.
Vous avez lu 0 articles sur Numerama ce mois-ci
Tout le monde n'a pas les moyens de payer pour l'information.
C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Mais si vous le pouvez,
voici trois bonnes raisons de soutenir notre travail :
- 1 Numerama+ contribue à offrir une expérience gratuite à tous les lecteurs de Numerama.
- 2 Vous profiterez d'une lecture sans publicité, de nombreuses fonctions avancées de lecture et des contenus exclusifs.
- 3 Aider Numerama dans sa mission : comprendre le présent pour anticiper l'avenir.
Si vous croyez en un web gratuit et à une information de qualité accessible au plus grand nombre, rejoignez Numerama+.
Toute l'actu tech en un clin d'œil
Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !
Pour ne rien manquer de l’actualité, suivez Numerama sur Google !












