Definition

Analytique avancée

Cette définition fait partie de notre Guide Essentiel : Data Storytelling : comment mettre la donnée en scène pour diffuser la Data Science

Les outils analytiques « traditionnels » – comme la Business Intelligence classique – se concentrent sur l’historique des données pour les interpréter. L’analytique avancée se concentre sur la prévision d’événements et de comportements futurs. Cette forme d’analytique permet aux entreprises de mener des simulations pour évaluer les effets de changements dans leurs stratégies.

Suite de l'article ci-dessous

L’analyse prédictive, le data mining, l’analytique Big Data et le Machine Learning, sont quelques-unes des catégories que l’on regroupe sous le terme d’analytique avancée.

L’analytique avancée se démocratise dans les entreprises en même temps que la quantité de données de plus en plus importante qu’elles génèrent. En effet, les modèles d’analyse prédictive – et, en particulier, ceux à base de Machine Learning – nécessitent un entraînement important des algorithmes pour qu’ils puissent identifier correctement les corrélations avant de pouvoir faire une prédiction. Le Big Data ouvre la porte à ces techniques d’analytique avancée.

Les techniques de l’analytique avancée

L’analytique avancée repose sur des approches mathématiques pour interpréter les données. Ces approches partent des méthodes statistiques classiques et vont jusqu’au Machine Learning et au Deep Learning pour identifier des schémas récurrents, des corrélations et des segments dans des ensembles de données, puis pour extrapoler les futures données et les futures décisions.

Dans de nombreux cas, ces analyses prédictives et prescriptives complexes nécessitent un spécialiste des données très qualifié (le Data Scientist). Ces profils ont à la fois une formation approfondie en mathématiques, en langages informatiques – le plus souvent Python et R – et une bonne connaissance des métiers.

Les outils

Il existe un grand nombre d’outils d’analytique avancée. Ils se répartissent généralement en deux catégories : l’open source et les logiciels propriétaires.

Les outils open source sont devenus une option incontournable. Ils vont des langages de programmation aux environnements, comme Hadoop et Spark. Les utilisateurs disent généralement qu’ils apprécient ces outils parce qu’ils sont généralement peu coûteux à exploiter, qu’ils offrent de solides fonctionnalités et qu’ils sont soutenus par une communauté qui innove continuellement.

Du côté des outils propriétaires, les éditeurs sont pléthoriques (SAS, Microsoft, Google, IBM, Oracle, etc.). Tout comme pour les outils open source, la plupart exigent une connaissance technique poussée et une forte compréhension des techniques mathématiques.

Toutefois, ces dernières années, des outils d’analytique en libre-service sont apparus pour rendre la BI plus accessible aux utilisateurs métiers. L’analytique avancée suit ce même chemin. Bien que les outils d’analytique avancée en libre-service soient plus limités que ceux dédiés aux Data Scientists, ils permettent aux utilisateurs métier de concevoir et de designer eux même des modèles prédictifs (les Citizen Data Scientist).

Cette définition a été mise à jour en mars 2020

Pour approfondir sur Intelligence Artificielle et Data Science

Close