Big Data Paris : la difficile quête du Data Scientist

Une table ronde organisée lors de la conférence Big Data Paris a mis une nouvelle fois en avant la difficulté de trouver des Data Scientists. Un profil complexe, qui tarde à arriver sur le marché.

« Le Big Data est peu soluble dans les organisations des entreprises », rappelait ce matin Jeremy Harroch, Fondateur de la société QuantMetry, spécialisée dans l’analyse statistique, à l’occasion de la conférence Big Data Paris. Une phrase qui pourrait s'expliquer par la rareté, voire la pénurie, des très recherchés Data Scientists,  qui n'est pas sans conséquences sur l'émergence d'approches Big Data dans les entreprises.

Lors d’une table ronde, plusieurs spécialistes se sont accordés sur le fait qu’aujourd’hui, les entreprises devaient apprendre en marchant, faute de profils d’experts clairement définis. Globalement, si ces profils sont encore rares, c’est également parce qu’ils sont complexes et requièrent de multiples compétences. Jeremy Harroch a ainsi identifié trois niveaux de maturité de profils qui se positionnent : « un profil junior qui a déjà reçu une solide formation académique, -  ils sont peu nombreux mais sont capables de s’adapter très vite-, ceux qui ont déjà fait carrière et, ceux qui s’y intéressent par passion, comme les ingénieurs. Ils sont très rares et très recherchés et sont capables de gérer les juniors. Et d’autres enfin, d’un profil plus seniors et plus orienté sur la gestion et la politique des données ».

Il y aurait donc plusieurs types de data scientist, ce que vient confirmer les profils variés des diplômés de la première promo du master Big Data de Telecom ParisTech. Egalement présent lors de cette table ronde, Stéphan Clemencon, qui dirige le master, explique que la sélection a été effectuée sur des profils d’ingénieurs avec entre 2 à 4 d’expérience ou encore d’autres en cours de reconversion professionnelle, à la recherche d’expérience plus technique. Même son de cloche chez Emmanuel Stanislas, fondateur de Clementine, un cabinet de recrutement spécialisé IT, qui confirme certes avoir affaire à des ingénieurs avec de fortes compétences autour des algorithmes. « On leur demande d’être techniques mais également d’être câblé business », souligne-t-il. Confirmant ainsi que le profil de Data Scientist est pluriel.

Face à cette mixité, tous s’accordent sur un point. Avec ce profil que l’on sait évolutif, sans trop savoir vers où se dirige la profession, et face à la nécessité d’y associer des compétences métiers, le Data Scientist doit « savoir se remettre en cause » et « pouvoir s’adapter et évoluer dans une équipe pluri-disciplinaire », s’il souhaite trouver actuellement une place dans une entreprise.

Reste qu'avec des profils trop rares sur le marché, et des formations tout juste émergentes, les entreprises doivent composer avec la matière grise existante. La Poste, par exemple, dans le cadre d’un vaste projet de collecte d’informations sur le courrier, baptisé Orest TAE a dû mettre en place une équipe d’informaticiens du groupe et via une approche agile les faire évoluer progressivement vers un profil plus tourné vers la science de la donnée. Le projet de la Poste vise à proposer une vision générale des flux de courriers,afin d’identifier des litiges dans le traitement (110 millions de documents sont traités par jour) et de pouvoir les exposer cela aux utilisateurs, résume Denis Weiss, DSI Industrie de La Poste. Il  a nécessité de d'impliquer des personnes « qui savaient coder et étaient capables de se remettre en cause ». Et de construire progressivement leur expérience de Data Scientist. « Nous avons démarré en 2009 avec une approche agile pour les faire progresser en fonction des besoins », et les faire changer leur mode de fonctionnement.

Du fait de la rareté des compétences, mais aussi de la nature "haut de gamme" des profils concernés, nait une inflation des rémunérations associées. Aujourd’hui, indique Emmanuel Stanislas, le salaire d’un Data Scientist est en moyenne 20% supérieur à celui d’un informaticien.

Pour approfondir sur Big Data et Data lake

Close