Pour innover, l’Acoss et l’Urssaf misent sur le partage de données

L’Acoss, caisse nationale du réseau de l’Urssaf, a profité de son obligation de partage de données pour pousser sa démarche vers la co-innovation avec les entreprises et les startups.

L’Agence centrale des organismes de sécurité sociale (ACOSS) est la caisse nationale du réseau de l’Urssaf. Pour l’ensemble des caisses de recouvrements (Cnav, Cnam, Cnaf), elle a une mission importante de traitement de données.

Suite de l'article ci-dessous
« Nous récupérons des informations sur chaque salarié. »
Yann-Gaël AmgharDirecteur général, Acoss

« Nous sommes dépositaires d’un patrimoine de données qui s’est très fortement enrichi avec le déploiement de la déclaration sociale nominative adressée aux employeurs. Nous récupérons des informations sur chaque salarié », déclare Yann-Gaël Amghar, directeur général de l’Acoss.

La déclaration sociale nominative (DSN) est issue d’une démarche de dématérialisation entamée par l’État afin d’alléger les procédures administratives. Ce sous-produit de la fiche de paie donne des indices sur la vie en entreprise d’un salarié (maladie, maternité, changement d’un élément du contrat de travail, fin de contrat de travail, etc.). Elle est devenue obligatoire le 1er janvier 2017.

La DSN n’est pas la seule source de connaissance de l’agence nationale. Les données produites par l’Acoss proviennent des informations récoltées par les Urssaf auprès des entreprises et l’analyse économique du territoire français.

« Notre rôle c’est de mettre à disposition du grand public ces informations. »
Yann-Gaël AmgharAcoss

Or ce patrimoine étant commun, l’Urssaf et l’Acoss ont l’obligation de publier une partie de ses données. « Notre rôle c’est de mettre à disposition du grand public ces informations, afin qu’il puisse en faire des usages de recherches, d’études, ou de conception d’applications. Nous ne détenons pas seuls le savoir pour valoriser ces données », affirme Yann-Gaël Amghar.

Afin de faciliter la mise à disposition de ces données anonymisées aux acteurs économiques, sociaux et scientifiques, l’Acoss et l’Urssaf misent sur un plan d’Open Innovation. Celui-ci repose en grande partie sur la collaboration en interne, et l’appel à projets auprès d’entreprises et de startups. Il est matérialisé par le Lab Urssaf, un « catalyseur d’innovation » inauguré en décembre 2019, et la création de la direction de l’innovation et du digital chez l’Accos, il y a 19 mois. 

Ouvrir les données au grand public et aux entreprises

De ce plan émerge la volonté de mettre en place un portail de partage de données en plus des publications périodiques déjà proposées par l’Acoss. Celui-ci se nomme open.urssaf. Il contient un « catalogue de données », soit 21 jeux de données disponibles (14 au lancement en mars 2020), des data visualisations pour le grand public, ainsi que des API et des outils de création de cartes pour exploiter ces données. Ces API sont soit ouvertes – pour ceux qui souhaitent utiliser les données à des fins non lucratives – soit adressées – sous des conditions particulières – à des partenaires qui veulent s’appuyer sur ces informations pour créer des services ou des applications.

« Le portail est la porte d’entrée pour les offreurs de services qui veulent nous présenter leurs projets », assure Carole Leclerc, directrice de l’innovation et du digital chez l’Acoss. La page Web permet en effet de collecter les projets et les demandes de contact des entreprises ou startups.

Sur le portail open.urssaf, figurent surtout les déclarations préalables à l’embauche par secteur et par région, les taux d’impayés mensuels pour les entreprises de dix salariés ou plus, le nombre d’autoentrepreneurs par département et leur chiffre d’affaires, etc.  

Ces jeux triés par secteur, par région géographique, par an ou par trimestre sont partagés sous la contrainte du secret statistique. Les données sont donc anonymisées et parfois agrégées. Par ailleurs, l’Acoss ne peut pas renseigner le même niveau de détail par département et par activité, pour éviter que dans les zones les moins peuplées l’identification des entreprises soit trop aisée. 

Le choix d’un éditeur proche du secteur public

Pour choisir l’architecte de ce portail, l’Acoss a organisé en 2019 un « pitch contest », comme elle prévoyait de le faire tous les mois avant le confinement. Opendatasoft (ODS) faisait partie des participants. 

« Les standards utilisés par Opendatasoft sont maintenant bien connus des acteurs du marché. »
Carole LeclercDirectrice innovation et digital, Acoss

« Il se trouve qu’Opendatasoft répondait parfaitement aux critères du dispositif que nous souhaitions mettre en place. Cet acteur est très bien implanté sur le marché de l’open data. Sa manière de présenter l’information entre dans les usages. Les standards utilisés par Opendatasoft sont maintenant bien connus des acteurs du marché », explique Carole Leclerc.

La plateforme mise en place avec l’appui d’ODS permet de filtrer les données (sous licence ODbl) pour les faire apparaître dans une table ou dans un tableau de bord de visualisation. L’utilisateur peut exporter les fichiers aux formats CSV, JSON ou XLS (ce dernier était le seul format disponible avant la mise en place du portail). Les API générées automatiquement facilitent la connexion des informations actualisées vers d’autres outils d’analyse ou de visualisation. 

Les entreprises peuvent par exemple croiser les données concernant l’activité économique et le nombre de concurrents dans leur secteur avec un référentiel géographique pour déterminer le meilleur endroit afin d’implanter leur commerce.

L’outil de visualisation intégré dans le portail est celui d’ODS. L’onglet « création de cartes » permet de sélectionner un fichier contenant le jeu de données souhaitées qui sera interprété pour afficher les statistiques sur une carte OpenStreetMaps. À l’utilisateur de choisir, depuis l’interface, le style de visualisation qu’il souhaite obtenir (cluster, points, carte de chaleur, etc.).

Avec l’outil « création de graphiques », tout un chacun peut créer des graphes (lignes, courbes, colonnes, barres, zones, polaires) et paramétrer les variables qui s’affichent sur les axes X et Y. Toutefois, il n’est pas possible de réaliser des visualisations sur l’ensemble des jeux de données depuis le portail open.urssaf.

Le produit SaaS d’Opendatasoft utilisé par l’Urssaf est hébergé dans le cloud de 3DS Outscale pour assurer la souveraineté de l’infrastructure IT. L’agence nationale doit assurer une localisation « 100 % française » des données en termes géographiques et juridiques. Selon, Jean-Marc Lazard, PDG d’Opendatasoft, la moitié des clients de l’éditeur proviennent du secteur public, et une majorité d’entre eux sont français et utilisent les infrastructures cloud de la filiale de Dassault Systèmes. Les statisticiens et techniciens de l’Acoss gèrent le back-office et le front-office.

« L’ouverture du portail nous entraîne à travailler des données que nous n’aurions pas mises à disposition immédiatement. »
Alain GubianDirecteur statistiques études et prévisions, Acoss

Si Opendatasoft assure que les déploiements peuvent se faire en une semaine, le projet a demandé près d’un an de travail et de collaboration avec l’Acoss. Non pas que les jeux de données devaient être nettoyés ; les statisticiens de l’agence les préparent et les utilisent de longue date. « En revanche, l’ouverture du portail nous entraîne à travailler des données que nous n’aurions pas mises à disposition immédiatement, par exemple sur les primes d’intéressement ou sur les heures supplémentaires », affirme Alain Gubian, directeur des statistiques, des études et de la prévision et directeur financier chez l’Acoss.

Il fallait obtenir les autorisations pour diffuser certains jeux de données, établir les règles de partage et orienter la lecture des informations pour le grand public. Par exemple, les filtres pour trier les informations disponibles depuis le portail ont été conçus par les collaborateurs de l’Acoss.

L’agence et le réseau de l’Urssaf mettent à jour les données de manière régulière et tablent sur une publication mensuelle. « C’est l’usage du portail qui va nous indiquer comment prioriser l’ouverture des données. Nous avons mis à disposition un ensemble de jeux de données au lancement d’open.urssaf. Pour la suite, nous avons besoin d’interagir avec les utilisateurs et les partenaires », estime Carole Leclerc.

Pour approfondir sur Secteur public

Close