为什么 AI 在处理新闻方面如此糟糕

  新闻流淌在我的血液里。我的日常工作是一家新闻摄影机构的负责人,而我的主网站是一个专注于旧金山湾区新闻的站点。

  我与新闻内容息息相关,所以我对 AI 在处理新闻方面的糟糕表现感受尤为深刻。

  哥伦比亚新闻评论(Columbia Journalism Review)的一项新研究表明,像 Perplexity 这样的 AI 搜索引擎,以及像 Gemini 这样的聊天机器人,在正确报道和引用新闻故事方面一贯表现不佳。

  该研究调查的其中一个聊天机器人——埃隆·马斯克的 X 推出的 Grok 3,在超过 90% 的情况下错误报道新闻。

  这些机器人会自信满满地填充错误信息,引用 Yahoo! News 等平台上的转载版本,而不是原始来源,甚至会违反出版商的服务条款,爬取那些明令禁止 AI 访问的网站。

  最终的结果是什么?任何希望能够通过 AI 机器人获取新闻内容的人,最终都会感到失望——甚至有可能接触到有害的错误信息。

  为什么 AI 机器人在处理新闻方面表现如此糟糕?问题归结于它们的训练方式。

  像 Perplexity、ChatGPT 和 Gemini 这样的聊天机器人,都是在数十亿页的文本数据上进行训练的,其中一些数据还可以追溯到几百年前。

  它们的主要目标是从这些训练数据中找到模式,这使它们能够相当准确地回答许多问题。

  但新闻的问题就在于,它从定义上来说就是“新的”。聊天机器人在此前从未见过新闻文章中的信息,因此,它们很难准确理解并呈现这些信息。

  想象一下一个老式的天平秤。一边放着数十亿页的数据——来源包括所有出版过的书籍、网络上的所有网站,甚至是从 Reddit 这类公司购买的原始对话数据。

  当 LLM(大语言模型)在回答用户关于某篇新闻报道的查询时,你认为哪一边会占据主导地位?

  答案显然是那一侧庞大的训练数据。LLM 根本没办法超越其训练数据,准确地将新闻文章整合进它们的回答中。

  这暴露了像 OpenAI 和 Perplexity 这样的企业存在的一个重大缺陷。但与此同时,这也为创作者带来了一个巨大机会。

  在过去一年多的时间里,谷歌等传统搜索引擎似乎一直在努力——且有系统地——打压独立博客的内容。许多博主的自然搜索流量下降了 95%,甚至像《太阳报》(The Sun)这样的大型网站也遭遇了 50% 以上的流量损失。

  这一切特别大程度上归因于 AI。谷歌推出了极其成功的 AI 概览(AI Overviews),直接在搜索出来的结果页面提供 AI 生成的答案。这些答案往往取代了本应指向独立博客的搜索结果。

  然而,现在谷歌似乎正在朝着相反的方向转变。就在昨天,该公司发布了其核心算法更新(Core Update)。在发布说明中,谷歌表示,此次更新——以及今年晚些时候的更多更新——专门旨在提升创作者的内容。

  “这是一项常规更新,旨在更好地展现来自很多类型网站的相关且令人满意的内容。今年,我们还将继续通过一系列改进来提高创作者内容的可见度。”

  在我的网站上,我亲眼看到谷歌在特意提升新闻内容。我主网站上高质量、由人撰写的新闻内容流量本月增长了 200% 以上,其他人也开始报告类似的增长。

  相反,他们可能已开始意识到——考虑到 AI 驱动的竞争对手在处理新闻方面表现得有多糟糕——他们自己在理解和呈现新闻内容方面的专业能力,是一个巨大的优势。

  在过去一年里,谷歌的市场占有率一直在下降。离开谷歌的用户通常会转向 Perplexity 或 ChatGPT 这样的聊天机器人。

  这主要是因为,在回答诸如“牛排要煎到几度才可以做到五分熟?”这样的基础问题时,谷歌并不比这些 AI 驱动的服务做得更好。

  事实上,在许多情况下,谷歌自己的 AI 概览(AI Overviews)甚至比 ChatGPT 这类工具的 AI 答案更糟糕。

  但谷歌能做到一些这些工具做不到的事情——它能够给大家提供来自独立创作者和博主的准确、及时、原创的新闻内容。

  谷歌自 2002 年以来就运营着一个新闻部门,拥有数十年的新闻内容理解经验。而许多新闻机构明确阻止 Perplexity 之类的 AI 聊天机器人抓取他们的内容,但几乎所有人都欢迎谷歌的爬虫,因为大家都想要从谷歌搜索引擎获取高价值的自然流量。

  这种广泛的访问权限让谷歌拥有一个独特的突发新闻数据库可通过。而它的 AI 竞争对手由于缺乏这种访问权限,自然就错过了这些数据。

  从这次更新的官方目标来看,谷歌似乎终于意识到,自己几十年的经验和庞大的数据储备给了它巨大的竞争优势。

  去年,谷歌甚至邀请了 20 位博主前往其山景城总部,向他们取经,探讨如何更好地支持独立创作者。几位参会者离开后都表示,他们感觉谷歌终于开始认认真真地对待创作者内容的问题了。

  当然,谷歌绝不会完全放弃 AI 生成的内容。AI 概览的经济效益——让用户留在谷歌自己的平台上,而不是引导他们前往外部网站——实在是太诱人了,不可能被忽视。

  但它很有可能会做的事情是,开始加强(甚至替换)新闻相关查询中的 AI 概览,改用原创创作者内容。

  对于创作者来说,信息已经很明确了——如果你想在谷歌上获得好的排名(以及在较小程度上,在 Bing 这样的传统搜索引擎上),你应该减少对常规信息类内容的关注,而更多地专注于新闻。

  至关重要的是,新闻内容不一定要是关于本地事件、政治公告或其他传统的“硬新闻”话题(尽管这一些内容确实表现良好)。你可以在任何领域或主题中找到符合的新闻内容。

  比如,一个美食创作者可以报道当前流行的新食材。例如,“迪拜巧克力”最近正在流行,关于它的报道可完全归入“新闻”类别。

  这一点再次对创作者有利。许多独立创作者对自己所关注的领域充满热情,他们真的亲身去参加了,实际观察、发现新事物。

  AI 也许能很好地总结不一样的编织针,但它没办法亲自去手工艺展会,发现编织领域的新趋势(比如智能纺织品和导电纱线),并在当天就带回报道,附上专家评论和分析。

  长期以来,作为一名内容创作者,感觉就像是在把自己变成一台机器——写那些毫无生气的 3000+ 字“信息型”文章,话题来源全靠关键词研究工具。

  而新闻内容则完全相反。它充满了许多活力,它让你走向世界。你可以用更吸引人、更有冲击力的方式写作(事实上,你通常必须这样做)。你能够迅速尝试新事物,当某个尝试失败时也能轻松放手——毕竟,明天总会有新的新闻可以报道。

上一篇:
下一篇: