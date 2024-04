Il existe un phénomène dans le langage de programmation Python qui affecte l’efficacité de la représentation des données et de la mémoire. Je l’appelle la « ligne invisible ».

Cette ligne invisible peut sembler inoffensive à première vue. Toutefois, elle peut avoir un impact significatif sur les performances d’une application, en particulier si les données stockées dans la mémoire d’une application doivent se déplacer entre des codes gérés par différentes plateformes logicielles. Ce problème est particulièrement prononcé lorsque des données sont échangées entre Python et un moteur d’exécution C++ natif, une situation omniprésente dans le domaine de l’IA et du machine learning.

Prenons l’exemple d’un algorithme simple connu sous le nom de somme préfixe ou de somme cumulative. L’algorithme de la somme des préfixes est assez simple.

Par souci de simplicité, nous créons une liste d’un million de un. Nous la parcourons ensuite par itération, en mettant à jour chaque élément pour qu’il soit la somme de lui-même et de l’élément précédent. Nous avons maintenant la somme préfixe de 1 million de un, qui est une liste de 1 à 1 million et un.

Nous pouvons l’exprimer en Python de la manière suivante :

list = [1] * 1_000_000 for i in range(1, len(list)): list[i] += list[i-1]

Pour mesurer le temps consacré à chaque élément, nous complétons le script par quelques « statements » de mesure du temps :

from time import time_ns list = [1] * 1_000_000 tik = time_ns() for i in range(1, len(list)): list[i] += list[i-1] tok = time_ns() print(f"Time spent per element: {(tok - tik) / len(list)} ns")

Sur mon fidèle ordinateur portable (11 th Gen Intel Core i7-1165G7 cadencé à 2,80 GHz × 8 threads, fonctionnant sous Ubuntu 22.04.3 LTS et Python 3.11.5), le résultat est d’environ 52,88 nanosecondes (ns) par élément.

Est-ce une bonne chose ? Peut-être, mais il est difficile de savoir si l’on roule vite quand on est seul sur la route. Nous allons donc tenter le même calcul avec NumPy et établir une comparaison.

Qu’est-ce que NumPy ? NumPy est une librairie fondamentale pour le calcul scientifique, largement utilisée par les développeurs Python. Sous l’API Python, il effectue des calculs en C ou en Fortran pour accélérer Python. NumPy est livré avec une implémentation intégrée de la somme de préfixes, qui se présente comme suit : import numpy as np list = [1] * 1_000_000 tik = time_ns() list = np.cumsum(list) tok = time_ns() print(f"Time spent per element: {(tok - tik) / len(list)} ns") Cette version NumPy fonctionne admirablement, avec un temps de calcul d’environ 28,77 ns par élément, soit près de deux fois plus rapide que la version purement Python. Comparaison établie, nous avons un vainqueur incontestable. Cependant, avant de nous féliciter et de passer à autre chose, pouvons-nous aller encore plus vite ? Modifions un peu notre script et remplaçons la liste Python par un array NumPy : import numpy as np list = np.full(1_000_000, 1) tik = time_ns() list = np.cumsum(list) tok = time_ns() print(f"Time spent per element: {(tok - tik) / len(list)} ns") Et voilà que nous obtenons une vitesse fulgurante de 2,43 ns par élément. C’est plus de 10 fois plus rapide que la version NumPy précédente, et environ 20 fois plus rapide que l’implémentation Python.