red150770 - Fotolia

Conseil

Cinq pistes pour pallier la pénurie de Data Scientists

Mais où sont donc les Data Scientists ? En attendant de les trouver - s'ils existent - voici quelques moyens de gérer vos données et vos stratégies analytiques en exploitant au mieux vos ressources actuelles.

par

Ericka Chickowski

Publié le: 27 janv. 2020

A mesure que les entreprises s'appuient sur les données pour prendre des décisions et faire de la planification, la Data Science devient de plus en plus critique et les Data Scientists de plus en plus courus. Résultats, les entreprises n'arrivent pas à trouver suffisamment ce type de profils, d'autant plus que le réservoir de candidats qualifiés reste très limité.

Face à cette pénurie, les organisations optent pour des approches diverses, pour tirer le maximum des experts « data » qu'elles arrivent à trouver, à engager (et à conserver).

Automatisation

Une grande partie du travail (même si ce n'est pas le plus intéressant) des Data Scientists concerne la gestion des données, avec des tâches comme identifier les sources, fusionner des jeux de données ou validation de la qualité des données.

Toutes ces tâches, plutôt rébarbatives, peuvent être améliorées grâce à l'automatisation ce qui libère du temps aux Data Scientists.

« Le développement de modèles et leur mise en production opérationnelle peuvent être considérablement simplifiés par l'automatisation », estime Ryohei Fujimaki, PDG et fondateur de DotData - un éditeur spécialisé dans le Machine Learning. « Les nouvelles plates-formes d'automatisation de la Data Science permettront de déployer, d'exploiter et de maintenir des processus en production avec un minimum d'efforts, ce qui aidera les entreprises à maximiser leurs investissements en IA et ML et leur équipe de données actuelle ».

Analytique en libre service

L'automatisation doit servir à aider les experts seniors de la donnée (ceux qui tiennent souvent le rôle de Data Scientists). Mais elle peut - et doit aussi - démocratiser les ressources pour les rendre accessibles aux experts métiers qui peuvent alors devenir des « Citizen Data Scientists ».

« Les progrès de l'automatisation de la partie Data Engineering - quand on les ajoute à la montée en puissance des "citizen analystes" grâce à l'analytique en libre-service - libèrent encore plus de ressources [aux Data Scientists] qui peuvent dès lors se concentrer sur leurs activités à plus forte valeur ajoutée, comme la construction du prochain modèle de ML ou d'IA [qui convient à un projet interne] », confirme Matthew Baird, fondateur et directeur technique d'AtScale, spécialiste de la Data Virtualization.

Constituer des équipes Data pluridisciplinaires

Dans le même temps, les entreprises peuvent se heurter aux limites de l'analytique en libre-service et de l'automatisation.

« Tout outil qui simplifie limite également la flexibilité et les options des utilisateurs, ce qui signifie que certaines tâches complexes [de Data Sciences] qui nécessitent une personnalisation sont impossibles », prévient Chris Nicholson, fondateur et PDG de Pathmind, un spécialiste du Deep Learning. Selon lui, cet état de fait a conduit de nombreuses entreprises à explorer de nouvelles stratégies pour constituer de nouvelles équipes transverses.

« Beaucoup d'entreprises pallient la pénurie de Data Scientists en créant des équipes pluridisciplinaires internes qui travaillent avec de nombreuses unités métiers et en engageant des consultants externes », a constaté Chris Nicholson. « Souvent, ce qui limite la valeur de la data science n'est pas tellement la rareté des talents eux-mêmes ; c'est souvent plus la manière dont l'entreprise recueille les données et la façon dont elle permet aux gens d'y accéder et de les traiter ».

Les équipes pluri-disciplinaires peuvent aider à contourner les silos de données fragmentées, qui sont nés au fil des obstacles techniques et politiques.

Elles sont également utiles pour contrer un autre problème très courant qui fait croire que l'on n'a pas assez de Data Scientists en interne. Beaucoup de projets semblent en effet impossibles à gérer à cause de cette pénurie... alors qu'en fait ils sont ingérables parce que leur valeur métier est introuvable et qu'ils font donc perdre beaucoup d'énergie à lutter contre des moulins à vent.

« Trop de projets amènent les Data Scientists à lutter contre des moulins à vent. On leur jette un ensemble de données et on leur dit "voyez ce que vous pouvez faire avec ça !" », regrette Sten Vesterli, consultant chez More Than Code, un cabinet de conseils basé au Danemark. « Résultat, nous voyons que plus de 80 % des projets en phase de Labs ne passent jamais en prod. Les entreprises doivent vraiment affecter leurs Data Scientists à des projets dont les objectifs sont clairs et la valeur métier importante. »

Mieux définir les poste de Data Science

Un problème qui empêche de recruter des Data Scientists vient aussi du fait que les entreprises ont une acceptation bien trop large de ce type de titre et de cette fonction, prévient Amy Hodler, directrice des programmes d'IA chez Neo4j.

« Cette définition trop large, fait qu'il est difficile de trouver la bonne personne [...] et ceux qui sont recrutés ont plus de mal à comprendre ce que l'on veut d'eux et à tenir les objectifs de l'entreprise », ajoute-t-elle.

Amy Hodler prédit qu'au cours de l'année, les organisations commenceront à diversifier les annonces liées à la Data Science, en créant des sous-catégories de postes aux compétences plus ciblées.

Formation interne

Amy Hodler pense également que le marché va de plus en plus répondre à la pénurie de spécialistes avec des formations internes pour les employés qui présentent un potentiel - ou un désir - de s'orienter vers le domaine de la Data Science.

« Il faut se préparer aux concepts qui seront clefs pour construire les projets des années à venir. »

Amy HodlerDirectrice des programmes d'IA, Neo4j

Mais cette stratégie peut tout aussi bien être une bonne idée que mener à l'échec.

« Une vision à long terme est indispensable pour évaluer et définir des compétences qui ne se cantonnent pas aux outils et aux approches à la mode aujourd'hui. Il faut se préparer aux concepts qui seront clefs pour construire les projets des années à venir », résume Amy Hodler qui conclut que « constituer des binômes de Data Scientists juniors et seniors deviendra crucial pour faire évoluer ces employés [formés en interne] et les garder. »

Cinq pistes pour pallier la pénurie de Data Scientists

Mais où sont donc les Data Scientists ? En attendant de les trouver - s'ils existent - voici quelques moyens de gérer vos données et vos stratégies analytiques en exploitant au mieux vos ressources actuelles.

Automatisation

Mieux définir les poste de Data Science

Formation interne

Pour approfondir sur Intelligence Artificielle et Data Science

Les 14 compétences les plus recherchées en science des données pour réussir

Data Science : « L’analytique, c’est aussi une transformation profonde des métiers » (Dataiku)

Machine learning en production : un « mythe » s’écroule

Les compétences en intelligence artificielle : une quête complexe et coûteuse