Haberleri yapay zekâdan istemenin iyi bir fikir olmayabileceğini bir çalışma ortaya koyuyor.
Günümüzdeki yapay zekâ, büyük dil modellerine (LLM’ler) dayanır; bunlar, çok büyük miktarda veriye erişim sağlandığında kelimenin tam anlamıyla evrimleşebilen sofistike algoritma kümeleridir. “Dil” burada anahtar kelimedir — zira insanlar gibi iletişim kurmayı öğrenmek, erken dönem YZ’lerin ilk başarılarından biriydi. Dolayısıyla, onları dil ile ilgili görevlerde kullanmak LLM’lerin en yaygın uygulamalarından biridir; özetleme de — hemen hemen her şeyin — muhtemelen en sık yaptıkları iştir.
Bu da oldukça bağımlılık yapıcı: haber medyasını taze bilgi için taramak yerine, seçtiğiniz YZ’ye ilgi duyduğunuz bir konuyla ilgili her şeyi bulmasını ve sizin için kapsamlı bir derleme hazırlamasını söylersiniz. Sekreteriniz varmış gibi; ama daha ucuz ve insan faktörü olmadan, bu da sunulan özetleri daha güvenilir kılar. Öyle mi? Yanlış, BBC ve EBU’nun çalışmasının (European Broadcasting Union) gösterdiği gibi.
Yöntem
Araştırmacılar, haberle ilgili sorgulara yanıt olarak modeller — ChatGPT, Microsoft Copilot, Google Gemini ve Perplexity AI — tarafından üretilen 3000 yapay zekâ yanıtını değerlendirdi. İşte bazıları:
- Valensiya’daki sellerin nedeni neydi?
- Vaping zararlı mı?
- İskoçya’daki bağımsızlık referandumu tartışmalarında son durum nedir?
- İşçi Partisi ne vaat etti?
- Ukrayna maden anlaşması nedir?
- Trump üçüncü bir dönem için aday olabilir mi?
Sorgular, Avrupa ve Kuzey Amerika’dan 18 ülkedeki kamu hizmeti yayıncılarının yayımladığı doğrulanmış, olgusal haberlere dayanarak oluşturuldu.
Her bir sorgu, farklı dillerde (İngilizce, Fransızca, Almanca vb.) YZ’lere iletildi. Araştırmacılar doğruluğu, özgün haber içeriğine sadakati ve kaynak gösteriminin açıklığını değerlendirdi.
Yapay zekâ tarafından üretilen haber özetleri: kusurlar
Makale oldukça şaşırtıcı bulgular bildirdi:
- LLM’ler tarafından hazırlanan haberle ilgili yanıtların yaklaşık %45’inde, yanlış olgulardan yanıltıcı yeniden anlatımlara ve bağlamın çarpıtılmasına kadar en az bir “önemli sorun” vardı.
- Sorgu ve yanıtın hangi dilde olduğu, hangi coğrafyadan veya platformdan geldikleri önemli değildi: sorunlar tutarlı biçimde mevcuttu.
Yapay zekâ etrafındaki ilk tartışma olmasa da — ve elbette son da olmayacak — en azından bu durum, eski haber tüketimi rutinlerine dönülerek kolayca önlenebilir.