Ptát se umělé inteligence na zprávy možná není dobrý...

Ptát se umělé inteligence na zprávy možná není dobrý nápad, ukazuje studie.

Zvyk žádat AI, aby shromažďovala zprávy, se může rychle ujmout, ale není nejzdravější, protože model může informace zkreslovat, zjistila studie.

Jim Richards,
11 hours ago
Editor Informer Technologies, Inc.

Ptát se umělé inteligence na zprávy možná není dobrý nápad, ukazuje studie.

Současná umělá inteligence spoléhá na velké jazykové modely (LLM), sofistikované soubory algoritmů, které se při přístupu k obrovskému množství dat mohou doslova vyvíjet. “Jazyk” je zde klíčové slovo — koneckonců, naučit se komunikovat podobně jako lidé bylo jedním z prvních úspěchů raných AI. Není tedy divu, že jejich využití pro jazykové úlohy patří k nejběžnějším aplikacím LLM, přičemž sumarizace — no, vlastně čehokoli — je pravděpodobně úkol, který pro ně bývá nejčastější.

Je to také dost návykové: místo abyste pročesávali zpravodajská média kvůli čerstvým informacím, prostě své zvolené AI řeknete, aby vyhledala vše o tématu, které vás zajímá, a připravila pro vás komplexní souhrn. Jako mít sekretářku, jen levnější a bez lidského faktoru, což má činit poskytnuté souhrny důvěryhodnějšími. Že? Kdepak, jak zjišťuje studie BBC a EBU (Evropská vysílací unie).

Metodika

Výzkumníci posoudili 3000 odpovědí generovaných AI, které modely — ChatGPT, Microsoft Copilot, Google Gemini a Perplexity AI — vytvořily v reakci na zpravodajské dotazy. Zde je několik z nich:

Co způsobilo povodně ve Valencii?
Je vapování škodlivé?
Jaké jsou novinky v debatě o referendu o nezávislosti ve Skotsku?
Co slíbila Labouristická strana?
Co je dohoda o ukrajinských nerostných surovinách?
Může Trump kandidovat na třetí funkční období?

Dotazy byly sestaveny na základě ověřených, faktických zpráv zveřejněných veřejnoprávními vysílateli z 18 evropských a severoamerických zemí.

Každý dotaz byl umělým inteligencím předložen v různých jazycích (angličtině, francouzštině, němčině atd.). Výzkumníci hodnotili přesnost, věrnost původnímu zpravodajskému obsahu a srozumitelnost uvádění zdrojů.

Souhrny zpráv generované AI: nedostatky

Studie uvádí poměrně překvapivá zjištění:

Zhruba 45 % odpovědí ke zpravodajským tématům připravených LLM mělo alespoň jeden “významný problém” — od nepřesných faktů přes zavádějící parafráze až po zkreslení kontextu.
Nezáleželo na jazyce dotazu ani odpovědi, geografii či platformě: problémy se vyskytovaly konzistentně.

Ačkoli nejde o první kontroverzi kolem umělé inteligence — a jistě ne poslední — této se lze alespoň snadno vyhnout návratem k dřívějším způsobům sledování zpráv.