Hugging Face
Qu'est-ce que le "Hugging Face" ?
Hugging Face est une plateforme et une communauté d'apprentissage machine (ML) et de science des données qui aide les utilisateurs à construire, déployer et entraîner des modèles d'apprentissage machine.
Il fournit l'infrastructure nécessaire à la démonstration, à l'exécution et au déploiement de l'intelligence artificielle (IA) dans des applications réelles. Les utilisateurs peuvent également parcourir les modèles et les ensembles de données que d'autres personnes ont téléchargés. Hugging Face est souvent appelé le GitHub de l'apprentissage automatique, car il permet aux développeurs de partager et de tester leur travail ouvertement.
Hugging Face est connu pour sa bibliothèque de Transformers Python, qui simplifie le processus de téléchargement et d'entraînement des modèles ML. La bibliothèque offre aux développeurs un moyen efficace d'inclure l'un des modèles ML hébergés sur Hugging Face dans leur flux de travail et de créer des pipelines ML.
La plateforme est importante en raison de sa nature open source et de ses outils de déploiement. Elle permet aux utilisateurs de partager des ressources, des modèles et des recherches et de réduire le temps de formation des modèles, la consommation de ressources et l'impact environnemental du développement de l'IA.
Hugging Face Inc. est la société américaine qui a créé la plateforme Hugging Face. La société a été fondée à New York en 2016 par les entrepreneurs français Clément Delangue, Julien Chaumond et Thomas Wolf. À l'origine, l'entreprise a développé une application de chatbot du même nom pour les adolescents. L'entreprise a changé d'orientation pour devenir une plateforme d'apprentissage automatique après avoir mis en open source le modèle derrière l'application de chatbot.
En 2023, la société a annoncé un partenariat avec Amazon Web Services pour mettre les produits Hugging Face à la disposition des clients d'AWS afin qu'ils puissent créer des applications personnalisées. Google, Amazon et Nvidia ne sont que quelques-unes des entreprises qui ont investi dans la startup à ce jour.
Comment utilise-t-on le "Hugging Face" ?
Hugging Face est une plateforme d'IA et une communauté de soutien. La communauté utilise Hugging Face pour faire ce qui suit :
- Mettre en œuvre des modèles d'apprentissage automatique. Les utilisateurs peuvent télécharger des modèles d'apprentissage automatique sur la plateforme. Il existe des modèles pour une variété de fonctions, y compris le traitement du langage naturel (NLP), la vision par ordinateur, la génération d'images et l'audio.
- Partagez et découvrez des modèles d'apprentissage automatique. Grâce à Spaces et à la bibliothèque Hugging Face Transformers, les chercheurs et les développeurs peuvent partager des modèles avec la communauté. Les autres utilisateurs peuvent télécharger ces modèles et les utiliser dans leurs propres applications.
- Partager et découvrir des ensembles de données. Les chercheurs et les développeurs peuvent partager des ensembles de données pour entraîner des modèles d'apprentissage automatique ou découvrir des ensembles de données pour entraîner leurs modèles grâce à la bibliothèque Datasets.
- Affiner les modèles. Les utilisateurs peuvent affiner et former des modèles d'apprentissage profond à l'aide des outils de l'interface de programmation d'applications (API) de Hugging Face.
- Accueillir des démonstrations. Hugging Face permet aux utilisateurs de créer des démonstrations interactives de modèles d'apprentissage automatique dans le navigateur. Cela permet aux utilisateurs de présenter et de tester les modèles plus facilement.
- La recherche. Hugging Face a participé à des projets de recherche collaborative, tels que l'atelier de recherche BigScience, visant à faire progresser le domaine du NLP. Le site héberge également une page contenant une liste de documents de recherche.
- Développez des applications professionnelles. Hugging Face's Enterprise Hub permet aux utilisateurs professionnels de travailler avec des transformateurs, des ensembles de données et des bibliothèques open source dans un environnement hébergé privé.
- Évaluer les modèles d'apprentissage automatique. Hugging Face donne accès à une bibliothèque de codes pour l'évaluation de modèles d'apprentissage automatique et d'ensembles de données.
Caractéristiques d'Hugging Face
Le Hub Hugging Face est l'endroit où l'on trouve les principales caractéristiques de Hugging Face, notamment les suivantes :
- Modèles. Hugging Face héberge une vaste bibliothèque de modèles que les utilisateurs peuvent filtrer par type. À l'heure où nous écrivons ces lignes, il y a plus de 300 000 modèles sur Hugging Face. Hugging Face héberge également certains des meilleurs modèles ML open source sur la plateforme. Parmi les modèles figurant dans le classement au moment de la rédaction de cet article, on peut citer les suivants :
- stabilityai/stable-diffusion-xl-base-1.0.
- WizardLM/WizardCoder-Python-34B-V1.0.
- Phind/Phind-CodeLlama-34B-v2.
- Les ensembles de données. Les ensembles de données aident à former des modèles pour comprendre les modèles et les relations entre les données - et il peut être difficile de créer un bon ensemble de données. Hugging Face donne accès à des ensembles de données téléchargés par la communauté et auxquels les utilisateurs peuvent accéder. Voici quelques exemples d'ensembles de données dans la bibliothèque de Hugging Face :
- the_pile_books3, qui contient toutes les données de Bibliotik en texte clair. Bibliotik est un dépôt de 197 000 livres.
- wikipedia, qui contient des données de Wikipedia.
- Anthropic/hh-rlhf, qui contient des données sur les préférences humaines concernant l'utilité et l'innocuité des résultats de l'IA.
- imdb, qui contient une vaste collection de critiques de films.
- Spaces. Les modèles d'apprentissage automatique nécessitent généralement des connaissances techniques pour être mis en œuvre et utilisés. Spaces regroupe les modèles dans une expérience conviviale qui permet aux utilisateurs de présenter leur travail. Hugging Face fournit les ressources informatiques nécessaires à l'hébergement des démonstrations. L'utilisation de Spaces ne nécessite aucune connaissance technique. Voici quelques exemples d'espaces Hugging Face :
- LoRA le générateur d'images de l'explorateur. Les utilisateurs peuvent générer des images dans une variété de styles différents sur la base d'une invite.
- MusicGen générateur de musique. MusicGen permet aux utilisateurs de générer de la musique à partir d'une description du résultat souhaité ou d'un échantillon audio.
- Image to story. Les utilisateurs peuvent télécharger une image et un grand modèle linguistique utilise la génération de texte pour écrire une histoire à partir de cette image.
Comment s'inscrire à Hugging Face
L'inscription à Hugging Face est gratuite pour les contributeurs de la communauté. Les utilisateurs obtiennent un dépôt basé sur Git où ils peuvent stocker des modèles, des ensembles de données et des espaces. Après avoir créé un compte, les utilisateurs peuvent effectuer les opérations suivantes :
- Vérifier le flux d'activité.
- Accédez à la plateforme Hugging Face.
- Créer des organisations ou des dépôts privés.
- Explorez leur profil et ajustez les paramètres.
- Lancer un nouveau modèle, un nouvel ensemble de données ou un nouvel espace.
- Découvrez les dernières tendances au sein de la communauté Hugging Face.
- Examinez les organisations dont l'utilisateur fait partie et accédez à leurs sections spécifiques.
- Accéder à des ressources et à de la documentation utiles sur les ML.
Hugging Face propose également un compte pro payant qui permet aux utilisateurs d'accéder à davantage de fonctionnalités, ainsi qu'un compte entreprise à un tarif légèrement plus élevé. Le compte entreprise ajoute des fonctions de sécurité et de contrôle d'accès de niveau entreprise, ainsi qu'une assistance clientèle dédiée.
Avantages de l'utilisation de Hugging Face
La nature communautaire et open source de Hugging Face présente plusieurs avantages :
- Accessibilité. Hugging Face aide les utilisateurs à contourner les exigences restrictives en matière de calcul et de compétences typiques du développement de l'IA. Le fait que Hugging Face fournisse des modèles pré-entraînés, des scripts de réglage fin et des API pour le déploiement facilite le processus de création de LLM.
- Intégration. Hugging Face aide les utilisateurs à intégrer plusieurs frameworks de ML. Par exemple, la bibliothèque Transformer s'intègre à d'autres frameworks ML tels que PyTorch et TensorFlow.
- Prototypage. Hugging Face permet le prototypage et le déploiement rapides d'applications NLP et ML.
- Communauté. Hugging Face donne accès à une vaste communauté, à des modèles continuellement mis à jour, ainsi qu'à de la documentation et à des tutoriels.
- Rentable. Hugging Face fournit des solutions rentables et évolutives pour les entreprises. Construire de grands modèles ML à partir de zéro peut être coûteux, et l'utilisation des modèles hébergés de Hugging Face permet d'économiser de l'argent.
Défis et considérations
Il y a également des considérations et des risques à mettre en balance avec les avantages du "Hugging Face", notamment les suivants :
- Préjugés. Comme tout modèle d'apprentissage automatique pré-entraîné, les modèles disponibles sur Hugging Face sont susceptibles d'être biaisés, ce qui peut amener le modèle à générer du contenu sexiste, raciste ou homophobe.
- Exigences en matière de calcul. Il existe des modèles plus importants sur Hugging Face qui nécessitent plus de calcul que la quantité par défaut fournie par la plateforme, que les utilisateurs devraient acheter. Par exemple, Bloom est un grand modèle linguistique multilingue dont l'exécution pourrait s'avérer coûteuse.
- Assistance. Les versions gratuite et pro de la plateforme ne disposent pas d'une assistance clientèle dédiée.
- Recherche de modèles. Il peut parfois être difficile de trouver les modèles ou les bibliothèques appropriés parmi les nombreux modèles ou bibliothèques hébergés sur la plateforme.
- Sécurité. Les entreprises qui utilisent Hugging Face doivent s'assurer que la plateforme offre des mesures de sécurité qui correspondent aux besoins de l'entreprise en matière de sécurité des données.
Hugging Face et l'écosystème de l'IA au sens large
Hugging Face renforce une approche plus collaborative du développement de l'IA par rapport à d'autres startups d'IA contemporaines, qui développent un service d'IA et font payer les gens pour l'utiliser tout en gardant le secret commercial sur les rouages internes de la technologie.
Alors que de plus en plus d'entreprises cherchent à développer leurs propres modèles d'IA, Hugging Face fournira aux développeurs les outils nécessaires à cette fin. Comme le dit le proverbe : Dans une ruée vers l'or, il faut vendre des pelles. De nombreuses grandes entreprises collaborent déjà avec Hugging Face pour tirer parti de sa plateforme de développement.
L'objectif de Hugging Face est de permettre à un grand nombre de personnes d'accéder à l'IA au lieu de la restreindre à quelques acteurs clés. Certains employés d'entreprises d'IA générative pensent que l'IA open source sera plus compétitive que les fournisseurs d'IA "closed source" tels qu'OpenAI et Google. Une communication divulguée par un chercheur de Google au début de l'année 2023 exprime l'opinion du chercheur selon laquelle Google n'a "pas de fossé" dans l'industrie : "Pendant que nous nous chamaillions, une troisième faction a tranquillement mangé notre déjeuner.
