Ptát se umělé inteligence na zprávy možná není dobrý nápad, ukazuje studie.
Současná umělá inteligence spoléhá na velké jazykové modely (LLM), sofistikované soubory algoritmů, které se při přístupu k obrovskému množství dat mohou doslova vyvíjet. “Jazyk” je zde klíčové slovo — koneckonců, naučit se komunikovat podobně jako lidé bylo jedním z prvních úspěchů raných AI. Není tedy divu, že jejich využití pro jazykové úlohy patří k nejběžnějším aplikacím LLM, přičemž sumarizace — no, vlastně čehokoli — je pravděpodobně úkol, který pro ně bývá nejčastější.
Je to také dost návykové: místo abyste pročesávali zpravodajská média kvůli čerstvým informacím, prostě své zvolené AI řeknete, aby vyhledala vše o tématu, které vás zajímá, a připravila pro vás komplexní souhrn. Jako mít sekretářku, jen levnější a bez lidského faktoru, což má činit poskytnuté souhrny důvěryhodnějšími. Že? Kdepak, jak zjišťuje studie BBC a EBU (Evropská vysílací unie).
Metodika
Výzkumníci posoudili 3000 odpovědí generovaných AI, které modely — ChatGPT, Microsoft Copilot, Google Gemini a Perplexity AI — vytvořily v reakci na zpravodajské dotazy. Zde je několik z nich:
- Co způsobilo povodně ve Valencii?
- Je vapování škodlivé?
- Jaké jsou novinky v debatě o referendu o nezávislosti ve Skotsku?
- Co slíbila Labouristická strana?
- Co je dohoda o ukrajinských nerostných surovinách?
- Může Trump kandidovat na třetí funkční období?
Dotazy byly sestaveny na základě ověřených, faktických zpráv zveřejněných veřejnoprávními vysílateli z 18 evropských a severoamerických zemí.
Každý dotaz byl umělým inteligencím předložen v různých jazycích (angličtině, francouzštině, němčině atd.). Výzkumníci hodnotili přesnost, věrnost původnímu zpravodajskému obsahu a srozumitelnost uvádění zdrojů.
Souhrny zpráv generované AI: nedostatky
Studie uvádí poměrně překvapivá zjištění:
- Zhruba 45 % odpovědí ke zpravodajským tématům připravených LLM mělo alespoň jeden “významný problém” — od nepřesných faktů přes zavádějící parafráze až po zkreslení kontextu.
- Nezáleželo na jazyce dotazu ani odpovědi, geografii či platformě: problémy se vyskytovaly konzistentně.
Ačkoli nejde o první kontroverzi kolem umělé inteligence — a jistě ne poslední — této se lze alespoň snadno vyhnout návratem k dřívějším způsobům sledování zpráv.