Definition

Base de données

Qu'est-ce qu'une base de données ?

Une base de données est un système d'information spécifique mise en place pour faciliter l'accès, la gestion et la mise à jour des informations. Les bases de données informatiques stockent généralement des agrégations d'enregistrements de données ou de fichiers contenant des informations, telles que des transactions de vente, des données sur les clients, des données financières et des informations sur les produits.

Les bases de données sont utilisées pour stocker, conserver et accéder à toutes sortes de données. Elles recueillent des informations sur des personnes, des lieux ou des choses. Ces informations sont rassemblées en un seul endroit afin de pouvoir être observées et analysées. Les bases de données peuvent être considérées comme une collection organisée d'informations.

À quoi servent les bases de données ?

Les entreprises utilisent les données stockées dans les bases de données pour prendre des décisions éclairées. Les organisations utilisent notamment les bases de données de la manière suivante :

  • Améliorer les processus commerciaux. Les entreprises collectent des données sur les processus commerciaux, tels que les ventes, le traitement des commandes et le service à la clientèle. Elles analysent ces données afin d'améliorer ces processus, de développer leurs activités et d'augmenter leur chiffre d'affaires.
  • Garder une trace des clients. Les bases de données stockent souvent des informations sur des personnes, telles que des clients ou des utilisateurs. Par exemple, les plateformes de médias sociaux utilisent des bases de données pour stocker des informations sur les utilisateurs, telles que les noms, les adresses électroniques et le comportement des utilisateurs. Ces données sont utilisées pour recommander du contenu aux utilisateurs et améliorer leur expérience.
  • Sécuriser les données de santé personnelles. Les prestataires de soins de santé utilisent des bases de données pour stocker en toute sécurité des données de santé personnelles afin d'informer et d'améliorer les soins prodigués aux patients.
  • Stocker des données personnelles. Les bases de données peuvent également être utilisées pour stocker des informations personnelles. Par exemple, le stockage en cloud personnel permet aux utilisateurs individuels de stocker des médias, tels que des photos, dans un cloud géré.

Évolution des bases de données

Les bases de données ont été créées pour la première fois dans les années 1960. Ces premières bases de données étaient des modèles de réseau où chaque enregistrement est lié à de nombreux enregistrements primaires et secondaires. Les bases de données hiérarchiques faisaient également partie des premiers modèles. Elles présentent des schémas arborescents avec un répertoire racine d'enregistrements lié à plusieurs sous-répertoires.

Les bases de données relationnelles ont été développées dans les années 1970. Les bases de données orientées objet ont suivi dans les années 1980. Aujourd'hui, nous utilisons le langage de requête structuré (SQL), les bases de données NoSQL et les bases de données cloud.

E.F. Codd a créé la base de données relationnelle alors qu'il travaillait chez IBM. Elle est devenue la norme pour les systèmes de base de données en raison de son schéma logique, c'est-à-dire de la manière dont elle est organisée. L'utilisation d'un schéma logique sépare la base de données relationnelle du stockage physique.

La base de données relationnelle, combinée à la croissance de l'internet à partir du milieu des années 1990, a entraîné une prolifération des bases de données. De nombreuses applications commerciales et grand public s'appuient sur des bases de données.

Types de bases de données

Il existe de nombreux types de bases de données. Elles peuvent être classées en fonction du type de contenu : bibliographique, texte intégral, numérique et images. En informatique, les bases de données sont souvent classées en fonction de l'approche organisationnelle qu'elles utilisent.

Voici quelques-unes des principales bases de données organisationnelles :

Relationnel. Cette approche tabulaire définit les données de manière à ce qu'elles puissent être réorganisées et consultées de différentes manières. Les bases de données relationnelles sont constituées de tables. Les données sont placées dans des catégories prédéfinies dans ces tables. Chaque tableau comporte des colonnes avec au moins une catégorie de données et des lignes qui contiennent une certaine instance de données pour les catégories définies dans les colonnes. Dans une base de données relationnelle, les informations relatives à un client spécifique sont organisées en lignes, colonnes et tables. Celles-ci sont indexées pour faciliter la recherche à l'aide de requêtes SQL ou NoSQL.

Les bases de données relationnelles utilisent SQL dans leurs interfaces de programme utilisateur et d'application. Une nouvelle catégorie de données peut facilement être ajoutée à une base de données relationnelle sans qu'il soit nécessaire de modifier les applications existantes. Un système de gestion de base de données relationnelle (SGBDR) est utilisé pour stocker, gérer, interroger et récupérer des données dans une base de données relationnelle.

En règle générale, le SGBDR permet aux utilisateurs de contrôler l'accès en lecture/écriture, de spécifier la génération de rapports et d'analyser l'utilisation. Certaines bases de données offrent la conformité à la norme ACID (atomicité, cohérence, isolation et durabilité) pour garantir la cohérence des données et l'intégrité des transactions.

Distribuée. Cette base de données stocke des enregistrements ou des fichiers à plusieurs endroits. Le traitement des données est également réparti et répliqué sur différentes parties du réseau.

Les bases de données distribuées peuvent être homogènes, c'est-à-dire que tous les sites physiques ont le même matériel sous-jacent et utilisent les mêmes systèmes d'exploitation et applications de base de données. Elles peuvent également être hétérogènes. Dans ce cas, le matériel, le système d'exploitation et les applications de base de données peuvent être différents d'un site à l'autre.

Cloud. Ces bases de données sont construites dans un cloud public, privé ou hybride pour un environnement virtualisé. Les utilisateurs sont facturés en fonction de la quantité de stockage et de la largeur de bande qu'ils utilisent. Ils bénéficient également d'une évolutivité à la demande et d'une haute disponibilité. Ces bases de données peuvent fonctionner avec des applications déployées sous forme de logiciel en tant que service.

NoSQL. Les bases de données NoSQL sont adaptées au traitement de grandes collections de données distribuées. Elles peuvent résoudre les problèmes de performance des big data mieux que les bases de données relationnelles. Elles analysent également bien les grands ensembles de données non structurées et les données sur des serveurs virtuels dans le cloud. Ces bases de données peuvent également être appelées bases de données non relationnelles.

Orientées objet. Ces bases de données contiennent des données créées à l'aide de langages de programmation orientés objet. Elles se concentrent sur l'organisation des objets plutôt que sur celle des actions et des données plutôt que sur celle de la logique. Par exemple, un enregistrement de données d'image serait un objet de données plutôt qu'une valeur alphanumérique.

Graphique. Ces bases de données sont un type de base de données NoSQL. Elles stockent, cartographient et interrogent les relations en utilisant les concepts de la théorie des graphes. Les bases de données graphiques sont constituées de nœuds et d'arêtes. Les nœuds sont des entités qui relient les nœuds entre eux.

Ces bases de données sont souvent utilisées pour analyser les interconnexions. Les bases de données graphiques sont souvent utilisées pour analyser les données relatives aux clients qui interagissent avec une entreprise sur des pages web et dans les médias sociaux.

Les bases de données graphiques utilisent SPARQL, un langage de programmation déclaratif et un protocole, pour l'analyse. SPARQL peut effectuer toutes les analyses que SQL peut réaliser et peut également être utilisé pour l'analyse sémantique ou l'examen des relations. Il est donc utile pour effectuer des analyses sur des ensembles de données qui contiennent à la fois des données structurées et non structurées. SPARQL permet aux utilisateurs d'effectuer des analyses sur les informations stockées dans une base de données relationnelle, ainsi que sur les relations entre amis, le PageRank et le chemin le plus court.

table comparing graph and relational databases
Comparez les bases de données graphiques et relationnelles.

Quels sont les composants d'une base de données ?

Bien que les différents types de bases de données varient en termes de schéma, de structure de données et de types de données les plus adaptés, ils sont tous constitués des mêmes cinq composants de base.

  1. Matériel. Il s'agit de l'appareil physique sur lequel le logiciel de base de données fonctionne. Le matériel de base de données comprend les ordinateurs, les serveurs et les disques durs.
  2. Logiciel. Le logiciel ou l'application de base de données permet aux utilisateurs de contrôler la base de données. Les logiciels de systèmes de gestion de bases de données (SGBD) sont utilisés pour gérer et contrôler les bases de données.
  3. Les données. Il s'agit des informations brutes que la base de données stocke. Les administrateurs de base de données organisent les données pour les rendre plus significatives.
  4. Langage d'accès aux données. Il s'agit du langage de programmation qui contrôle la base de données. Le langage de programmation et le SGBD doivent fonctionner ensemble. L'un des langages de base de données les plus courants est SQL.
  5. Les procédures. Ces règles déterminent le fonctionnement de la base de données et la manière dont elle traite les données.

Quels sont les défis liés aux bases de données ?

La mise en place, l'exploitation et la maintenance d'une base de données posent des problèmes communs, tels que les suivants :

  • La sécurité des données est nécessaire parce que les données sont un actif précieux pour l'entreprise. La protection des données nécessite un personnel qualifié en cybersécurité, ce qui peut s'avérer coûteux.
  • L'intégrité des données garantit la fiabilité des données. Il n'est pas toujours facile d'assurer l'intégrité des données, car cela implique de limiter l'accès aux bases de données aux seules personnes qualifiées pour les manipuler.
  • Les performances des bases de données nécessitent des mises à jour et une maintenance régulières. Sans un soutien approprié, la fonctionnalité de la base de données peut diminuer au fur et à mesure que la technologie sur laquelle elle repose évolue ou que les données qu'elle contient changent.
  • L'intégration des bases de données peut également s'avérer difficile. Elle peut impliquer l'intégration de sources de données provenant de différents types de bases de données et de structures dans une base de données unique ou dans des lacs de données (data lakes) et des entrepôts de données (datawarehouse).
DBMS diagram
Les API relient l'utilisateur ou l'application au système de gestion de la base de données, ce qui leur permet d'interagir avec la base de données.

Qu'est-ce qu'un système de gestion de base de données ?

Un SGBD permet aux utilisateurs de créer et de gérer une base de données. Il aide également les utilisateurs à créer, lire, mettre à jour et supprimer des données dans une base de données, et il contribue aux fonctions de journalisation et d'audit.

Le SGBD assure l'indépendance physique et logique des données. Les utilisateurs et les applications n'ont pas besoin de connaître l'emplacement physique ou logique des données. Un SGBD peut également limiter et contrôler l'accès à la base de données et fournir des vues différentes du même schéma de base de données à plusieurs utilisateurs.

En savoir plus sur l'état actuel de la gestion des données et sur la place des bases de données.

Cette définition a été mise à jour en septembre 2014

Pour approfondir sur Base de données