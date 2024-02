Un problème courant en informatique et en programmation consiste à déterminer si une liste contient des entrées en double.

Il existe heureusement plusieurs techniques pour éviter ces doublons avec Python. Dans un premier temps, nous allons voir la différence de performance entre une solution triviale et une autre optimisée.

Une première méthode triviale, mais peu efficace à large échelle

La façon la plus simple de résoudre ce problème consiste à comparer chaque élément de la liste. Cette méthode renverra sans aucun doute la bonne réponse et fonctionnera dans des délais raisonnables tant que la taille de la liste demeure contrainte. En revanche, le temps d’exécution augmentera de manière quadratique au fur et à mesure que la taille de la liste augmente.

def check_duplicate_trivial(items):

for idx in range ( len (items)):

for inner in range ( len (items)):

if inner == idx:

continue # do not compare to itself

if items[inner] == items[idx]:

return True

return False

Il s’agit d’une boucle à l’intérieur d’une boucle – la boucle extérieure est l’index de l’élément que nous comparons, et tous les autres éléments sont indexés à l’aide de la boucle intérieure. Cette implémentation triviale est vraiment inadaptée aux grandes listes – elle multiplie au carré le nombre de comparaisons d’éléments.

Nous pouvons quelque peu améliorer cette méthode. Si la fonction trouve un doublon, elle se termine en retournant à ce point. Dans la majorité des cas, cette méthode sera nettement plus rapide et, au pire, elle continuera à comparer chaque item à tous les autres.