研究发现,向人工智能询问新闻可能不是个好主意。 研究发现,向人工智能询问新闻可能不是个好主意。

当代人工智能依赖大型语言模型(LLM),这是一组复杂的算法,只要获取海量数据,就能真正不断进化。“语言”是关键词 — 毕竟,学会像人类那样交流是早期 AI 的首批成就之一。因此,用它们来处理与语言相关的任务成为 LLM 最常见的应用之一也就不足为奇了,其中,对——几乎任何内容——进行摘要,可能是它们执行得最频繁的工作。

这也相当让人上瘾:与其在各大新闻媒体中苦苦搜寻最新信息,你只需让自己选择的 AI 查找你感兴趣主题的全部内容,并为你准备一份全面的梳理。就像拥有一名秘书,但更便宜,而且没有“人为因素”,这似乎让其提供的摘要更值得信赖。对吗?错了,正如 BBC 与 EBU 的研究(欧洲广播联盟)所发现的那样。

研究设计

研究人员评估了 3,000 个由这些模型 — ChatGPT、Microsoft Copilot、Google Gemini 和 Perplexity AI — 针对与新闻相关的查询生成的答案。以下是其中一些查询:

  • 瓦伦西亚洪灾是由什么引起的?
  • 吸电子烟对健康有害吗?
  • 苏格兰独立公投辩论的最新进展是什么?
  • 工党作出了哪些承诺?
  • 乌克兰矿产协议是什么?
  • 特朗普能否竞选第三个任期?

这些查询是基于来自欧洲和北美 18 个国家的公共服务广播机构发布的经核实、基于事实的报道编制而成。

每个查询都以不同语言(英语、法语、德语等)提交给这些 AI。研究人员评估了其准确性、对原始新闻内容的忠实度以及来源的清晰度。

AI 生成的新闻摘要:存在的问题

该论文报告了一些颇为令人惊讶的发现:

  • 大约 45% 的与新闻相关的 LLM 回复至少存在一个“重大问题”,从事实不准确、具有误导性的改述,到对语境的曲解不等。
  • 查询和回答使用何种语言、来自何种地域或平台都无关紧要:这些问题始终普遍存在。

虽然这并非围绕人工智能的首次争议 — 当然也不会是最后一次 — 但至少,这一次可以通过回归以往的新闻获取方式而轻松规避。

作者的其他文章

Google 推出“恢复联系人”,一种找回账号的方式。
文章
Google 推出“恢复联系人”,一种找回账号的方式。
Google 在已知的两种账号恢复方法基础上又新增了一种。了解如何设置恢复联系人。
终于,面向家庭使用的AI超级计算机
文章
终于,面向家庭使用的AI超级计算机
Nvidia开始销售DGX Spark,这是一台能够运行2000亿参数模型的"个人AI超级计算机"。价格为$3,999。
如何在不受支持的电脑上安装 Windows 11
文章
如何在不受支持的电脑上安装 Windows 11
Windows 10 的支持将于 2025 年 10 月 14 日结束。如果你的电脑不受支持,请继续阅读,了解仍可升级到 Windows 11 的方法。
微软移除了使用本地账户安装 Windows 11 的一种方法
文章
微软移除了使用本地账户安装 Windows 11 的一种方法
Windows 11 很快将在安装时要求使用已连接的 Microsoft 帐户,封堵仅限本地安装的漏洞。不过,现在仍然还有时间。