Definition

Data science

Cette définition fait partie de notre Guide Essentiel : Data Storytelling : comment mettre la donnée en scène pour diffuser la Data Science

La data science (littéralement « science des données ») est une discipline qui étudie les informations : leur source, ce qu'elles représentent et les méthodes permettant de les transformer en ressources utiles pour la création de stratégies métier et IT.

L'extraction d'importants volumes de données, structurées ou non, permet aux organisations d'identifier des modèles qui les aident à maîtriser leurs coûts, à améliorer leur efficacité, à identifier de nouveaux débouchés commerciaux et à améliorer leur avantage concurrentiel.

La data science fait appel aux mathématiques, aux statistiques et à l'informatique et intègre des techniques telles que l'apprentissage statistique (apprentissage automatique), l'analyse topologique, l'exploration des données (data mining) et leur visualisation.

Data scientists

La quantité de données générées aujourd'hui par les entreprises ne cesse d'augmenter, de même que le nombre de data scientists missionnés pour transformer des données brutes en précieuses informations métier.
L'extraction de données consiste à récupérer certaines données de sources non ou mal structurées, puis à les traiter et à les analyser. Les data scientists doivent disposer de connaissances approfondies en analytique, en apprentissage automatique, en exploration des données et en statistiques, ainsi que d'une solide expérience des algorithmes et de la programmation. En plus de la gestion et de l'interprétation d'importantes masses de données, ils sont souvent chargés de créer des modèles de visualisation des données pour illustrer la valeur métier des informations numériques.

Les aptitudes liées à la Data science
Qualités de ceux qui font parler les données

Pour être efficaces, les data scientists doivent non seulement être des experts de l'analyse des données, mais ils doivent aussi faire preuve d'intelligence émotionnelle. Leur compétence la plus importante est sans doute leur capacité à présenter des informations décisionnelles exploitables, notamment aux dirigeants, et à en expliquer clairement la signification.

Les informations numériques étudiées par les data scientists proviennent d'une multitude de canaux et de sources : smartphones, périphériques de l'Internet des objets (IoT), réseau social, enquêtes, achats, recherches et comportement sur Internet. En opérant un tri dans ces grands ensembles de données et en analysant les données, les data scientists arrivent à faire émerger des modèles et à résoudre des problèmes ; ce processus est qualifié d'exploration des données.

Avantages de la data science

Globalement, la data science facilite et améliore la prise de décisions dans les entreprises. Grâce aux data scientists, les entreprises disposent d'éléments de preuves quantifiables et basés sur des données pour prendre leurs décisions métier.

A terme, les décisions basées sur les données peuvent améliorer la rentabilité, l'efficacité opérationnelle, la performance de l'entreprise et les flux de travail. Pour les entreprises au contact de clients, la data science facilite l'identification et l'ajustement des publics cibles. Elle est également au service du recrutement : le traitement interne des candidatures associé à des jeux et à des tests d'aptitude basés sur les données aident le service des ressources humaines à sélectionner les nouveaux embauchés, plus rapidement et plus précisément.

Les avantages de la data science varient selon l'objectif et le secteur d'activité de l'entreprise. Les services commerciaux et marketing, par exemple, peuvent explorer les données clients pour améliorer les taux de conversion ou créer des campagnes marketing personnalisées.

Les institutions bancaires y trouvent un moyen d'améliorer la détection de la fraude. Les services de streaming, tel Netflix, l'utilisent pour déterminer les centres d'intérêt de leurs utilisateurs et exploitent les données pour décider des émissions ou des films à produire. Netflix utilise également des algorithmes basés sur les données pour proposer des recommandations personnalisées en fonction de l'historique de visionnage des utilisateurs. Les entreprises de livraison – DHL, FedEx, UPS... – ont recours à la data science pour identifier les meilleurs itinéraires et horaires de livraison, ainsi que les meilleurs modes de transport.


Une journée dans la vie
d'un data scientist.

La data science n'est pas encore très développée dans l'entreprise, car l'identification et l'analyse d'un volume colossal de données non structurées sont parfois trop complexes, trop onéreuses et chronophages.

Data science et apprentissage automatique

L'apprentissage statistique (ou automatique) est généralement indissociable de la data science, car cet outil d'intelligence artificielle (IA) permet d'automatiser le traitement des données. Ses algorithmes évolués font leur propre apprentissage et peuvent traiter de très grandes quantités de données en un rien de temps comparé aux humains.

Une fois les données structurées issues des outils d'apprentissage automatique collectées et traitées, les data scientists doivent encore les interpréter, les convertir et en faire la synthèse pour présenter des informations exploitables aux décisionnaires des entreprises.

Les applications d'apprentissage automatique utilisées dans le champ de la data science intègrent la reconnaissance d'images et la reconnaissance vocale. Des algorithmes d'apprentissage automatique sont également embarqués dans les véhicules autonomes.

Cette définition a été mise à jour en avril 2019

Pour approfondir sur Outils décisionnels et analytiques

Close