Definition

Données non structurées

Les données non structurées sont une désignation générique qui décrit toute donnée extérieure à un type de structure.

Les données non structurées textuelles sont générées par les courriels, les présentations PowerPoint, les documents Word, ou encore les logiciels de collaboration ou de messagerie instantanée.

Les données non structurées non textuelles, quant à elles, sont générées via des supports tels que les images JPEG, les fichiers audio MP3, ou encore les fichiers vidéo Flash.

En l'absence d'administration, le volume impressionnant des données non structurées générées annuellement au sein d'une entreprise peut se révéler coûteux en termes de stockage. Et des données non administrées peuvent parallèlement poser un problème de responsabilité, par exemple si les informations ne peuvent pas être localisées dans le cadre d'un audit de conformité ou d'une action en justice.

Les informations que renferment les données non structurées ne sont pas toujours faciles à localiser. Cette localisation implique en effet que les données présentes dans des documents, tant électroniques que physiques, soient numérisées, afin de permettre à une application de recherche d'en extraire par analyse des concepts en fonction de termes utilisés dans des contextes spécifiques. Ce procédé est appelé recherche sémantique.

Dans les activités de clientèle, les informations que renferment les données non structurées sont analysées pour améliorer le marketing relationnel et la gestion des relations clientèle (CRM, Customer Relationship Management).

Cette définition a été mise à jour en août 2015

Pour approfondir sur Big Data et Data lake

Close