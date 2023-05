Depuis septembre 2020, LeMagIT propose tous les mois à ses lecteurs un véritable bulletin météo ransomware. Celui-ci s’appuie notamment sur le décompte des revendications de cyberattaques publiées par les cybercriminels, lequel est régulièrement corrigé et redressé. Mais LeMagIT compte également les attaques évoquées publiquement dans la presse du monde entier. Ce travail de veille a récemment été sensiblement amélioré avec l’aide de ChatGPT.

Un métaflux RSS dans une seule langue

Historiquement, l’actualité était suivie dans un classique lecteur RSS, en s’appuyant sur plusieurs flux RSS générés par Google News à partir de recherches sur les mots clés cyber et attaque, dans plusieurs langues et pour différentes régions du monde. Problème : les titres des articles sont dans leur langue d’origine. En outre, une même dépêche peut être reprise par différents titres. Et c’est sans compter avec les communiqués de presse parfois confondus avec de véritables articles de presse.

En l’absence de ressources internes de développement, nous avons fait appel à ChatGPT pour construire un script Python simplifiant notre travail de veille.

Extrait du code Python de génération du meta-flux RSS.

Ce script Python se charge de récupérer lesdits flux RSS, en ignorant certaines sources à l’intérêt trop limité. Dans la mesure du possible, les doublons sont supprimés. Les articles déjà collectés lors d’une précédente exécution du script sont également ignorés.

Les titres des articles provenant des sources non anglophones sont traduits en faisant appel à l’API de DeepL.

Le script Python ajoute alors les articles nouvellement trouvés à un métaflux RSS exclusivement anglophone. Hébergé sur GitHub, ce script est exécuté toutes les 30 minutes avec GitHub Actions. Le tout est accessible à tous, librement.