S'informer auprès d'une IA pourrait ne pas être une bonne idée, selon une étude.
L'intelligence artificielle contemporaine repose sur de grands modèles de langage (LLM), ensembles sophistiqués d'algorithmes qui, ayant accès à d'immenses quantités de données, peuvent littéralement évoluer. “Langage” est le mot-clé ici — après tout, apprendre à communiquer à la manière des humains a été l'une des premières réalisations des premières IA. Ainsi, il n'est pas surprenant que les utiliser pour des tâches liées au langage soit l'une des applications les plus courantes des LLM, la synthèse de, eh bien, à peu près n'importe quoi, étant probablement la tâche qu'ils effectuent le plus souvent.
C'est assez addictif, aussi : au lieu de fouiller les médias d'information à la recherche de nouveautés, il suffit de demander à l'IA de votre choix de trouver tout ce qui concerne un sujet qui vous intéresse et de vous préparer une synthèse complète. Comme avoir une secrétaire, mais moins cher et sans le facteur humain, ce qui rendrait les résumés fournis plus fiables. N'est-ce pas ? Faux, comme le montre l'étude de la BBC et de l'UER (Union européenne de radio‑télévision).
Le protocole
Les chercheurs ont évalué 3 000 réponses générées par l'IA, produites par les modèles — ChatGPT, Microsoft Copilot, Google Gemini et Perplexity AI — en réponse à des requêtes liées à l'actualité. En voici quelques-unes :
- Qu'est-ce qui a provoqué les inondations à Valence ?
- La vape est-elle mauvaise pour la santé ?
- Quelles sont les dernières informations sur le débat autour du référendum d'indépendance en Écosse ?
- Qu'a promis le Parti travailliste ?
- Quel est l'accord sur les minerais de l'Ukraine ?
- Trump peut-il se présenter pour un troisième mandat ?
Les requêtes ont été élaborées à partir de rapports factuels et vérifiés publiés par des radiodiffuseurs de service public de 18 pays européens et nord-américains.
Chaque requête a été soumise aux IA dans différentes langues (anglais, français, allemand, etc.). Les chercheurs ont évalué l'exactitude, la fidélité au contenu d'origine et la clarté des sources.
Synthèses d'actualités générées par l'IA : les défauts
L'étude a rapporté des résultats plutôt surprenants :
- Environ 45 % des réponses liées à l'actualité préparées par des LLM présentaient au moins un “problème significatif”, allant de faits inexacts à des paraphrases trompeuses, jusqu'à des déformations du contexte.
- Peu importaient la langue de la requête et de la réponse, la zone géographique ou la plateforme d'origine : les problèmes étaient présents de manière constante.
Ce n'est pas la première controverse autour de l'intelligence artificielle — et certainement pas la dernière — mais celle-ci, au moins, peut être facilement évitée en revenant aux anciennes habitudes de consommation de l'information.