La Caisse des allocations familiales utilise un algorithme
pour détecter les allocataires « à risque »
France Info, 9 décembre 2022
Depuis 2010, la Caisse nationale des allocations familiales (Cnaf) utilise des algorithmes pour noter les allocataires en fonction du risque qu’ils représentent. Une note qui joue ensuite dans les choix des contrôles effectués.
« On est devenu une mini-PME. On n’est plus là pour aider les gens, mais pour faire du chiffre. » Ainsi parle un « technicien conseil » qui travaille depuis plusieurs années au sein de l’une des 101 Caisses des allocations familiales (Caf) en France. « Notre prime d’intéressement est calculée en fonction des objectifs atteints par les caisses locales, explique le représentant CGT dans les instances nationales de la Sécurité sociale, Yves Alexis. Or parmi ces objectifs, il y a les délais de traitement, l’accueil… mais aussi la détection de fraudes. »
Et pour détecter ces fraudes, la Cnaf a recours à une méthode au nom très anglais : le « datamining ». C’est une technique numérique de statistiques prédictives qui, en croisant différentes données dans différentes administrations, est censée identifier les risques d’erreurs ou de fraude dans un dossier d’allocataire. Elle s’est généralisée au sein de la Cnaf à partir de 2010, avec l’utilisation d’algorithmes. « La Cnaf a été le laboratoire, le bon élève du datamining au sein des administrations françaises », explique le sociologue Vincent Dubois, professeur à l’Institut d’études politiques (IEP) de Strasbourg et auteur de l’ouvrage Contrôler les assistés. Genèses et usages d’un mot d’ordre (Ed. Raisons d’Agir). « Elle a développé une politique d’automatisation du déclenchement des contrôles. »
« Le tournant se situe au milieu des années 90, poursuit l’universitaire. Les organismes de protection sociale vont être poussés par le pouvoir politique à renforcer les contrôles. » À l’époque, l’État lance en effet une politique volontariste de lutte contre la fraude. « Nous avons décidé d’engager une action résolue contre les fraudes sociales, déclare Nicolas Sarkozy, le 15 novembre 2011, à Bordeaux. C’est la fraude qui mine les fondements même de cette République sociale que les frères d’armes de la Résistance ont voulu bâtir pour la France et qu’ils nous ont légué. Frauder la Sécurité sociale, ce n’est pas simplement abuser du système, profiter de ses largesses, c’est voler chacun et chacune d’entre nous. »
Des allocataires notés
Mais l’algorithme ne fait pas que détecter des risques d’erreurs ou de fraude. En mars 2021, après avoir échangé avec la Caf qui lui réclamait injustement un indu (un trop-perçu) de 542 euros, la journaliste indépendante Lucie Inland découvre qu’on lui a attribué un « score de risque ». « J’avais une note de 0,4. Je n’étais donc pas trop risquée… Mais un petit peu quand même, explique-t-elle. Je me suis alors rendu compte que ma déclaration d’aide au logement et de prime d’activité passait par la moulinette de l’algorithme de la Caf. »
« La Cnaf a créé un profil type de présumé fraudeur avec un certain nombre de caractéristiques, confirme Noémie Levain, juriste à La Quadrature du net. Un score de risque va ensuite être attribué à chaque allocataire. Plus ce score se rapproche de 1 et plus le risque de subir un contrôle est élevé. » « C’est devenu la pierre angulaire du déclenchement des contrôles, affirme Vincent Dubois. Cela s’appuie également sur une base de données extrêmement importante qui concerne les allocataires, mais aussi leur famille. »
Interrogée sur ce point, la Caf minimise l’utilisation de cette technologie. Selon elle, seuls 6 % de l’ensemble des contrôles seraient issus de l’outil datamining, tout en reconnaissant que 70 % des contrôles effectués en présence de l’allocataire, qui ont entraîné un remboursement d’allocation, ont bien été initiés par lui. En juin 2020, devant la Commission d’enquête relative à la lutte contre les fraudes aux prestations sociales, l’ancien directeur général de la Caf déclarait pour sa part que le datamining était « devenu la première source de détection des dossiers destinés au contrôle ».
Un taux de fraude « insignifiant »
« Avant l’utilisation du datamining, le contrôle s’effectuait dans une ambiance d’organisme social, se souvient Yves Alexis, représentant CGT et contrôleur de la Caf du Tarn et Garonne. On faisait une étude globale du dossier, en vérifiant la déclaration, mais en contrôlant aussi que l’intégralité des droits était bien versée. Désormais, c’est un peu l’inverse : le datamining cible les erreurs de saisie des allocataires, alors que ces erreurs sont rarement des fraudes. » Selon Vincent Dubois, « le fait qu’un dossier soit fortement ‘scoré’, comme on dit dans l’institution, place les contrôleurs dans la quasi-obligation de trouver quelque chose qui cloche ».
La Cour des comptes estime pourtant le montant des fraudes à 309 millions d’euros en 2021, soit un taux de 0,39 % rapporté à l’ensemble des prestations versées. « On met en place un énorme dispositif, alors que ce taux de fraude est insignifiant », regrette Didier Minot, le président du collectif Changer de cap qui prône un changement de la politique de la Caf en la matière. Un chiffre contesté par une estimation de la Caf basée sur un échantillon de 6 000 dossiers. Selon elle, les indus frauduleux se monteraient à 2,8 milliards d’euros. À titre de comparaison, selon la Cour des comptes, la fraude aux cotisations sociales des employeurs est estimée entre 7 et 25 milliards d’euros. Et la fraude fiscale qui échappe aux recettes de l’État est, quant à elle, estimée autour de 80 milliards d’euros.
Les précaires plus à risques
Parmi les critiques qui visent cet algorithme, il y a d’abord le fait qu’il ciblerait plus particulièrement les personnes précaires. « Contrairement à un contrôle aléatoire où chaque personne aurait la même probabilité d’être contrôlée, cet algorithme entraîne un score de risque élevé pour les personnes les plus précaires, parce qu’à leur statut sont associés des facteurs de risque qui sont en fait des facteurs de précarité, affirme un membre de l’association La Quadrature du net. C’est la raison pour laquelle, parmi les personnes contrôlées, on retrouve une surreprésentation de personnes aux minima sociaux. Plus quelqu’un est précaire, plus il est considéré comme ‘risqué’. »
La multiplication de déclarations de prestations (APL, prime d’activité, allocation adulte handicapé…) augmente aussi le risque d’erreur. « Les déclarations de ressources trimestrielles sont très complexes à remplir correctement », estime Bernadette Nantois qui travaille depuis plus de 20 ans au sein de l’association Apiced qui aide les travailleurs précaires. « Il y a souvent des erreurs de bonne foi, ce n’est pas de la fraude. »
« La moindre variation de ressource, le moindre changement dans la situation familiale du ménage va générer de manière quasi-automatique un contrôle, ajoute Bernadette Nantois. Avec, dans la majorité des cas, une suspension préventive des versements dont le ménage ou la famille bénéficiait jusque-là. » Pour elle, c’est « une population avec des revenus modestes, qui se retrouve, de fait, ciblée par l’algorithme ». Bernadette Nantois cite notamment le cas d’un dossier qu’elle a suivi d’une personne « contrôlée cinq fois en 15 mois, avec à chaque fois une suspension de droits. Il s’agit de quelqu’un qui bénéficiait de l’allocation adulte handicapé (AAH), à laquelle s’ajoutait le salaire au Smic de sa compagne, avec deux enfants à charge, dit-elle. Les contrôles étaient à chaque fois liés aux légères variations de ressources de sa compagne, de l’ordre de 50 ou 90 euros. »
« L’algorithme est conçu comme un miroir des situations statistiques sur les risques d’erreur, répond le directeur général de la Cnaf, Nicolas Grivel. Il n’y a rien de très sophistiqué ou de machiavélique : notre seule préoccupation c’est d’identifier les situations qui génèrent le plus d’erreurs et d’indus, afin d’éviter que les personnes ne génèrent des droits non justifiés pendant trop longtemps. »
Des situations dramatiques
L’autre point mis en avant par les détracteurs de l’algorithme, c’est le fait que la Caf ne respecterait pas toujours les procédures légales. « En théorie, une décision de trop perçu (d’indu), doit être motivée en droit, explique un avocat au barreau de Lyon spécialiste de ces procédures, Clément Terrasson. La Caf doit vous indiquer quel article de loi elle est en train d’appliquer. On doit vous donner la raison pour laquelle vous êtes censé rembourser cette somme. Or, c’est très rarement le cas. La Caf emploie souvent des formules un peu vagues comme : ‘Vos droits ont changé’ ou ‘Nous avons recalculé vos prestations’. »
« Dans le meilleur des cas, la personne reçoit une notification d’indu assez sommaire, constate également Didier Minot du collectif Changer de cap. On a étudié par exemple le cas d’une femme qui a reçu un document dans lequel on lui disait : ‘Suite au contrôle de votre dossier, nous avons constaté sur vos relevés bancaires que vos grands-parents vous aident régulièrement depuis octobre 2020. Or ces sommes n’ont pas été déclarées. Par conséquent nous vous inscrivons comme fraudeuse.’ C’est très violent. D’autant plus qu’il est indiqué ensuite que la charge de la preuve lui incombe et, en caractères gras, que la loi rend passible d’amende ou d’emprisonnement quiconque se rend coupable de fraude ou de fausse déclaration. Les neuf-dixième des gens sont démunis face à ces documents et n’ont pas les moyens de les contester. » Un constat que partage Bernadette Nantois qui a accompagné de nombreux allocataires au sein de l’association Apiced. « Une suspension de prestations durant plusieurs mois génère des situations dramatiques, avec des dettes et des frais bancaires colossaux. Il nous est même arrivé de prêter de l’argent à des personnes qui ne pouvaient plus assurer leurs dépenses quotidiennes. »
Dans la région lyonnaise, un homme a vécu ce type de situation. Suite à une mauvaise transmission d’informations entre l’Assurance maladie et la Caf, cette dernière lui a réclamé à tort 1 200 euros de trop-perçus (prime d’activité et RSA). En raison de cet indu de RSA, le département de Haute-Savoie lance un contrôle détaillé de sa situation : des dizaines de documents lui sont demandés, certains plusieurs fois. Le RSA lui est ensuite supprimé, au motif qu’il n’aurait pas transmis certains documents et fait obstacle au contrôle. Il lui faudra deux ans de procédure devant le Tribunal administratif, avant qu’il n’ait gain de cause et ne retrouve finalement ses droits. « Quand on vous suspend le RSA, vous tombez plus bas que terre, témoigne cet homme. Même si vous agitez les bras, on ne vous entend pas. Et vous vous retrouvez avec 1 000 euros de factures impayées d’électricité. Le plus difficile à vivre, c’est de se retrouver aux Restaurants du Cœur et d’aller, entre guillemets, mendier pour pouvoir manger. »
« Les Caf ont des prérogatives exorbitantes du droit commun puisqu’elles peuvent récupérer par la force de l’argent, sans jugement préalable, constate l’ancien haut-fonctionnaire Didier Minot. Cela leur impose une responsabilité qui devrait se traduire par un respect des règles de droit : présomption d’innocence, contradictoire, reste à vivre, c’est-à-dire un minimum vital. » Ce à quoi le directeur général de la Cnaf, Nicolas Grivel répond : « On ne procède jamais à une suspension pour le plaisir. Il y a toujours des échanges préalables. Les suspensions interviennent lorsqu’il y a des informations qui nous manquent pour s’assurer de la réalité d’une situation d’un allocataire. Notre mission de service public est de verser le juste droit. Certaines situations individuelles sont dramatiques. Mais notre but et notre moteur, c’est d’éviter ça. Sur 13 millions d’allocataires, il y a beaucoup de situations qui se passent sans difficultés. »
Parcours du combattant
En cas de contestation, l’allocataire peut saisir une Commission de recours amiable, et deux mois plus tard, la justice (le tribunal administratif ou le pôle social du tribunal judiciaire). « Entre le moment où on conteste l’indu et la réponse du tribunal, la somme litigieuse aura été récupérée par la Caf, assure l’avocat Clément Terrasson. C’est extrêmement problématique puisque ça valide le mode de fonctionnement potentiellement illégal de la Caf. Ça s’apparente à un déni de justice. »
« L’une des pratiques fréquentes de la Caf consiste à débloquer les droits de la personne, la veille ou le lendemain de l’audience, explique Bernadette Nantois. Mais cela ne signifie pas pour autant que les droits sont rétablis sur le long terme. Les procédures peuvent durer plusieurs années. » « Il y a une inégalité des armes, estime pour sa part Me Terrasson. Très souvent l’administration est crue sur parole, alors que l’allocataire doit tout justifier point par point. Et une fois qu’il est ‘labélisé fraudeur’, il est très compliqué de faire changer le regard du tribunal. »
Des propos que réfute, là encore, le directeur de la Caisse nationale des allocations familiales, Nicolas Grive : « Il n’existe aucune stratégie organisée de déstabilisation des allocataires par des procédures quelconques, nous sommes là pour les aider. Et la plupart du temps, ça se passe bien. Les Caf sont en permanence mobilisées pour accompagner les allocataires dans leurs droits. Des systèmes de médiation existent dans chaque Caf. Parfois, cela peut aller au contentieux. Mais nous agissons évidemment dans le cadre de la loi. »
Un algorithme très secret
Une autre interrogation porte sur le modèle de fonctionnement de l’algorithme utilisé par la Cnaf. En septembre 2017, dans un rapport, le Défenseur des droits avait alerté sur « les dangers » de l’utilisation du datamining. Il mettait notamment en garde contre un risque de discrimination, parce qu’une circulaire interne de la Cnaf datée de 2012 recommandait de « cibler les personnes nées hors de l’Union européenne ». “Plus qu’un ciblage sur des ‘risques présumés’, la pratique du datamining contraint à désigner des populations à risque et, ce faisant, conduit à instiller l’idée selon laquelle certaines catégories d’usagers seraient plus enclines à frauder », écrivait alors le Défenseur des droits. Interrogé sur ce point, la Cnaf n’a pas répondu.
De son côté, en 2010, la Commission nationale informatique et libertés (Cnil), a donné son feu vert à l’utilisation du datamining par la Cnaf. Mais depuis 2016, il existe tout de même des obligations légales à respecter pour les administrations. « Si quelqu’un en fait la demande, l’administration doit être capable d’expliquer quel rôle l’algorithme a joué dans la prise de décision qui concerne la personne », rappelle Soizic Pénicaud qui a travaillé sur le sujet au sein de l’État, à Etalab, un département de la Direction interministérielle du numérique. Mais ces obligations seraient assez peu respectées par les administrations. « Soit parce qu’elles manquent de ressources en interne, analyse Soizic Penicaud, soit parce qu’il existe des exceptions à ces obligations, lorsque les algorithmes concernent la sûreté et la sécurité de l’État. »
Pour en avoir le cœur net, l’association La Quadrature du net a demandé à la Cnaf de lui fournir le code source de son algorithme de contrôle, autrement dit : la formule utilisée pour aboutir au score de risque attribué aux allocataires. « Ils nous ont envoyé un fichier texte qui ne sert à rien, raconte un membre de l’association. Il y a une formule avec le nombre de variables utilisées pour calculer le score de risque, mais les noms de ces variables ont été masqués. On peut donc lire : ‘Variable 1’, ‘Variable 2’, ‘Variable 3’, etc. Comme si la Cnaf n’assumait pas cette surveillance des plus précaires. »
Du côté de la Cnaf, on répond qu’il s’agit simplement de préserver une certaine confidentialité face à la menace d’une fraude organisée qui pourrait, elle, intervenir à grande échelle. « Certaines données pourraient être utilisées par des personnes dont le but est de frauder le système par des méthodes assez sophistiquées (usurpation d’identité, faux documents), explique Nicolas Grivel. Face à cette fraude organisée que nous voulons combattre, il faut avoir un coup d’avance. Elle est minoritaire mais a un impact très fort sur le système social. C’est la raison pour laquelle nous avons créé un service national de lutte contre la fraude à enjeux. » Un service qui devrait regrouper trente personnes sur 700 contrôleurs.
Plusieurs chercheurs de l’Institut national de recherche en sciences et technologies du numérique (INRIA) ont également travaillé sur le calcul des aides au logement. « Conformément aux dispositions de la loi République numérique de 2016, l’algorithme de calcul du code source des aides au logement a été publié par la Cnaf en 2018, explique l’un de ses chercheurs, Denis Merigoux. Or, dès les prémices de notre étude, nous nous sommes aperçus que le code source publié avait été écrit dans le langage de programmation Cobol qui semble avoir été produit à l’aide d’un atelier de génie logiciel, ce qui en rend la lecture par un humain quasiment impossible. » Le chercheur souligne également que « seules les grandes organisations comme la Cnaf disposent des machines » pouvant lire ce code source.
Moins d’humains, plus d’ordinateurs
Cette contestation de l’utilisation des algorithmes par la Cnaf se double d’une critique plus large portant sur les conséquences de la numérisation et de la dématérialisation des dossiers des allocataires.« Les gens n’ont plus d’autre choix que de créer un espace en ligne », constate Bernadette Nantois qui conseille les travailleurs précaires et notamment immigrés. « Même quand on est alphabétisé, on n’est pas forcément à l’aise avec l’outil informatique. Ça touche aussi bien des personnes âgées que des jeunes très à l’aise avec un smartphone mais beaucoup moins quand il s’agit de faire des démarches en ligne sur des sites administratifs. » Selon l’Insee, 17 % de la population est touchée par ce qu’on appelle l’illectronisme, la difficulté face à l’outil numérique.
Cette difficulté se conjugue avec le nombre de guichets d’accueil qui se réduisent au sein des Caf. « Le but, c’est d’expédier les gens, raconte une personne chargée de l’accueil et qui tient à rester discrète. On nous explique qu’il faut les éduquer et les renvoyer sur Caf.fr. Dès qu’on a un entretien, le logiciel se déclenche et au bout d’un quart d’heure, le chronomètre commence à clignoter, en rouge. » À quoi Bernadette Nantois ajoute : « Derrière ces procédures, il y a une certaine vision de l’allocataire considéré comme un fraudeur en puissance. »
Interrogée sur ces différents témoignages, la Cnaf se défend d’être dans un tel état d’esprit. Son directeur général affirme que « la dimension humaine reste essentielle, elle est constitutive de la branche famille de la Sécurité sociale. » « Il y a beaucoup de personnes pour qui la dématérialisation a constitué une amélioration considérable, ajoute Nicolas Grivel. Pour d’autres catégories de la population, ce n’est pas l’outil adapté. Nous y prêtons une attention très forte. On essaye au maximum d’être proactifs, d’appeler les gens pour leur rendre un meilleur service, comme durant le Covid. »
Cette numérisation s’accompagne d’importants marchés publics passés avec des entreprises du secteur, mais aussi avec Atos, Cap Gemini ou Thalès. En octobre-novembre 2022, 470 millions d’euros de marchés publics ont ainsi été souscrits par la Cnaf pour différentes prestations de services. « Il y a notamment un contrat de 125 millions d’euros conclu avec Cap Gemini sur quatre ans pour gérer la relation avec les allocataires, souligne Didier Minot. Comme si l’ensemble du dispositif informatique glissait vers une privatisation. » Rien de tel n’est envisagé, répond la Cnaf. Nicolas Grivel affirme qu' »il s’agit de se faire appuyer ponctuellement par des prestataires sur une expertise particulière, tout en développant sa compétence interne ».
Mais en interne, le malaise semble profond. « Auparavant, lorsqu’on rentrait à la Sécurité sociale, on y restait : ce n’est plus le cas, constate Lise Charlebois, assistante sociale à la Caf du Doubs et membre du syndicat Sud. Depuis une dizaine d’années, on a des ruptures conventionnelles, des démissions. En 2021, dans notre Caf, 19 CDI sont partis, il y a eu six ruptures conventionnelles et une reconversion professionnelle. C’est énorme. La personne qui est partie en rupture conventionnelle m’a dit : ‘J’ai besoin de remettre du sens dans mon travail. Parce que ce que je fais n’en a plus.' » Dans ce contexte, le prochain contrat d’objectif et de gestion de la Cnaf pour les cinq ans à venir, doit être renégocié en 2023.
CAF : le numérique au service de l’exclusion et
du harcèlement des plus précaires
La Quadrature du net, 19 octobre 2022 (extrait)
Nourri des centaines de données dont la CAF dispose sur chaque allocataire1, l’algorithme évalue en continu leur situation afin de les classer, les trier, via l’attribution d’une note (« score de risque »). Cette note, mise à jour mensuellement, est ensuite utilisée par les équipes de contrôleurs·ses de la CAF pour sélectionner celles et ceux devant faire l’objet d’un contrôle approfondi2.
Les quelques informations disponibles révèlent que l’algorithme discrimine délibérément les précarisé·e·s. Ainsi, parmi les éléments que l’algorithme associe à un risque élevé d’abus, et impactant donc négativement la note d’un·e allocataire, on trouve le fait3 :
– D’avoir des revenus faibles,
– D’être au chômage ou de ne pas avoir de travail stable,
– D’être un parent isolé (80% des parents isolés sont des femmes),
– De dédier une part importante de ses revenus pour se loger,
– D’avoir de nombreux contacts avec la CAF (pour celleux qui oseraient demander de l’aide).
D’autres paramètres comme le lieu de résidence, le type de logement (social…), le mode de contact avec la CAF (téléphone, mail…) ou le fait d’être né·e hors de l’Union Européenne sont utilisés sans que l’on ne sache précisément comment ils affectent cette note4. Mais il est facile d’imaginer le sort réservé à une personne étrangère vivant en banlieue défavorisée. C’est ainsi que, depuis 2011, la CAF organise une véritable chasse numérique aux plus défavorisé·e·s, dont la conséquence est un sur-contrôle massif des personnes pauvres, étrangères et des femmes élevant seules un enfant.
Notes
1. Pour des détails techniques sur l’algorithme et son entraînement voir l’article de Pierre Collinet « Le datamining dans les caf: une réalité, des perspectives », écrit en 2013 et disponible ici. Il y explique notamment que l’entraînement de l’algorithme mobilise une base contenant plus de 1000 informations par allocataire. Le modèle final, après entraînement et sélection des variables les plus « intéressantes », se base sur quelques dizaines de variables. Y est aussi expliqué le fait que l’algorithme est entraîné pour détecter les indus et non les cas de fraude.
2. Les contrôles à la CAF sont de trois types. Les contrôles automatisés sont des procédures de vérification des déclarations des allocataires (revenus, situation professionnelle..), organisés via à l’interconnexion des fichiers administratifs (impôts, pôle emploi…). Ce sont de loin les plus nombreux. Les contrôles sur pièces consistent en la demande de pièces justificatives supplémentaires à l’allocataire. Enfin les contrôles sur place sont les moins nombreux mais les plus intrusifs. Réalisé par un.e contrôleur.se de la CAF, ils consistent en un contrôle approfondi de la situation de l’allocataire. Ce sont ces derniers qui sont aujourd’hui en très grande majorité déclenchés par l’algorithme suite à une dégradation de la note d’un allocataire (Voir Vincent Dubois, « Contrôler les assistés » p.258). Il est à noter que les contrôles sur place peuvent aussi provenir de signalements (police, pôle emploi, conseiller.ère.s…) ou de la définition de cibles-types définies soit localement soit nationalement(contrôles RSA, étudiants…). Ces deux catégories représentaient la plupart des raisons de déclenchement des contrôles avant le recours à l’algorithme.
3. La CAF entretient une forte opacité autour des critères régissant son fonctionnement. Elle refuse même de donner plus d’informations aux allocataires ayant fait l’objet d’un contrôle suite à une dégradation de leur score. ll n’existe pas de documents présentant l’ensemble des paramètres, et leur pondération, utilisés par l’algorithme dit de « régression logistique ». Les informations présentées ici sont issues des sources suivantes: l’avis de la CNIL portant sur l’algorithme; le livre de Vincent Dubois « Contrôler les assistés »; la Lettre n°23 de la Délégation Nationale à la lutte contre la fraude disponible ici (voir pages 9 à 12); le rapport « Lutte contre la fraude au prestations sociales » du Défenseur des Droits disponible ici. L’article de Pierre Collinet « Le datamining dans les caf: une réalité, des perspectives », disponible ici détaille notamment la construction de l’algorithme.
4. Sur l’utilisation de la nationalité comme facteur de risque, voir le rapport « Lutte contre la fraude au prestations sociales » du Défenseur des Droits disponible ici. Y est cité une circulaire interne de la CAF (n°2012-142 du 31 août 2012) recommandant notamment de « cibl[er] les personnes nées hors de l’Union européenne ». Le rôle de la DNLF dans le développement des outils de scoring y est aussi mentionné.