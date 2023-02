La NASA espère en premier lieu accélérer le traitement de deux types de données. D’un côté, elle entend optimiser la recherche d’informations dans les articles de recherche produits par ses équipes et la communauté scientifique. De l’autre, elle compte tirer partie des données de télédétection spatiale concernant la Terre pour observer et prévoir l’évolution du climat ainsi que propulser des applications utiles aux sauveteurs.

« Les modèles de fondation (une traduction littérale de « foundation models », N.D.L.R) font partie d’une vaste initiative au sein d’IBM Research », déclare Priya Nagpurkar, vice-présidente Hybrid Cloud Platform & Developer Productivity chez IBM Research.

« Cette technologie émergente qui peut ingérer de larges volumes de données non labellisées, « apprendre » à effectuer une tâche dans un domaine et à transférer ce savoir dans un autre domaine réduit considérablement les efforts de développement d’une IA », résume-t-elle. « Cela élimine également le besoin d’étiqueter de gros volumes de données ».

Typiquement, GPT-3, célèbre modèle NLG qui a donné naissance à ChatGPT, entre dans cette catégorie de modèle. « Chez IBM Research, nous croyons qu'il est temps de prendre ces avancées et de les appliquer à différentes modalités et domaines qui comptent particulièrement pour les entreprises et les clients d'IBM, ainsi que pour faire progresser la science », vante Prya Nagpukar.

Un équivalent de ChatGPT pour les chercheurs Les travaux d’exploration des articles de recherche ont déjà débuté entre la NASA et IBM Research. Les deux entités développent un premier modèle de fondation entraîné sur une base de 300 000 articles publiés dans les magazines scientifiques, dont ceux des associations American Geophysical Union (AGU) et American Meteorological Society (AMS). Le modèle NLP est en question est en cours « d’affinage » (fine-tuning en VO). « Nous entraînons notre modèle sur environ un dixième du volume de données utilisé pour former un modèle comme GPT-3 puisque nous nous concentrons sur les connaissances liées aux géosciences », précise Raghu Ganti, chercheur chez IBM Research. Plus tard, il sera couplé avec le set d’outils PrimeQA open source permettant de poser des questions et d’obtenir des réponses en langage naturel. La promesse est d’obtenir un résumé sourcé des derniers éléments de recherche sur un sujet lié à l’observation de la Terre. L’outil de benchmarking inclus dans PrimeQA a déjà permis de constater que le modèle développé conjointement par IBM Research et la NASA est plus performant sur ses données d’entraînement que BERT-E et RoBERTa, deux modèles NLP établis sur des « transformers» développés et améliorés par Google et Meta. La NASA espère commencer à utiliser ce modèle « dès le milieu de l’année en cours », anticipe Rahul Ramachandran, chercheur principal au Marshall Space Flight Center de la NASA. « Nous pensons aussi à la façon dont le modèle peut être utilisé pour améliorer la découverte de données et d'informations », précise le chercheur de la NASA. « Parce que les représentations vectorielles (embeddings en VO) incluent la notion de contexte, vous pouvez utiliser cela pour améliorer vos résultats de recherche. Et l'autre grande opportunité potentielle pour nous est d'augmenter certaines de nos activités d'intendance de données, que ce soit, pour faire la génération de méta documentation, l'annotation de mots clés, etc. », ajoute-t-il.