为什么 AI 在处理新闻方面如此糟糕

来源：leyu乐鱼体育官网入口全站发布时间：2025-04-15 08:28:54

新闻流淌在我的血液里。我的日常工作是一家新闻摄影机构的负责人，而我的主网站是一个专注于旧金山湾区新闻的站点。

我与新闻内容息息相关，所以我对 AI 在处理新闻方面的糟糕表现感受尤为深刻。

哥伦比亚新闻评论（Columbia Journalism Review）的一项新研究表明，像 Perplexity 这样的 AI 搜索引擎，以及像 Gemini 这样的聊天机器人，在正确报道和引用新闻故事方面一贯表现不佳。

该研究调查的其中一个聊天机器人——埃隆·马斯克的 X 推出的 Grok 3，在超过 90% 的情况下错误报道新闻。

这些机器人会自信满满地填充错误信息，引用 Yahoo! News 等平台上的转载版本，而不是原始来源，甚至会违反出版商的服务条款，爬取那些明令禁止 AI 访问的网站。

最终的结果是什么？任何希望能够通过 AI 机器人获取新闻内容的人，最终都会感到失望——甚至有可能接触到有害的错误信息。

为什么 AI 机器人在处理新闻方面表现如此糟糕？问题归结于它们的训练方式。

像 Perplexity、ChatGPT 和 Gemini 这样的聊天机器人，都是在数十亿页的文本数据上进行训练的，其中一些数据还可以追溯到几百年前。

它们的主要目标是从这些训练数据中找到模式，这使它们能够相当准确地回答许多问题。

但新闻的问题就在于，它从定义上来说就是“新的”。聊天机器人在此前从未见过新闻文章中的信息，因此，它们很难准确理解并呈现这些信息。

想象一下一个老式的天平秤。一边放着数十亿页的数据——来源包括所有出版过的书籍、网络上的所有网站，甚至是从 Reddit 这类公司购买的原始对话数据。

当 LLM（大语言模型）在回答用户关于某篇新闻报道的查询时，你认为哪一边会占据主导地位？

答案显然是那一侧庞大的训练数据。LLM 根本没办法超越其训练数据，准确地将新闻文章整合进它们的回答中。

这暴露了像 OpenAI 和 Perplexity 这样的企业存在的一个重大缺陷。但与此同时，这也为创作者带来了一个巨大机会。

在过去一年多的时间里，谷歌等传统搜索引擎似乎一直在努力——且有系统地——打压独立博客的内容。许多博主的自然搜索流量下降了 95%，甚至像《太阳报》（The Sun）这样的大型网站也遭遇了 50% 以上的流量损失。

这一切特别大程度上归因于 AI。谷歌推出了极其成功的 AI 概览（AI Overviews），直接在搜索出来的结果页面提供 AI 生成的答案。这些答案往往取代了本应指向独立博客的搜索结果。

然而，现在谷歌似乎正在朝着相反的方向转变。就在昨天，该公司发布了其核心算法更新（Core Update）。在发布说明中，谷歌表示，此次更新——以及今年晚些时候的更多更新——专门旨在提升创作者的内容。

“这是一项常规更新，旨在更好地展现来自很多类型网站的相关且令人满意的内容。今年，我们还将继续通过一系列改进来提高创作者内容的可见度。”

在我的网站上，我亲眼看到谷歌在特意提升新闻内容。我主网站上高质量、由人撰写的新闻内容流量本月增长了 200% 以上，其他人也开始报告类似的增长。

相反，他们可能已开始意识到——考虑到 AI 驱动的竞争对手在处理新闻方面表现得有多糟糕——他们自己在理解和呈现新闻内容方面的专业能力，是一个巨大的优势。

在过去一年里，谷歌的市场占有率一直在下降。离开谷歌的用户通常会转向 Perplexity 或 ChatGPT 这样的聊天机器人。

这主要是因为，在回答诸如“牛排要煎到几度才可以做到五分熟？”这样的基础问题时，谷歌并不比这些 AI 驱动的服务做得更好。

事实上，在许多情况下，谷歌自己的 AI 概览（AI Overviews）甚至比 ChatGPT 这类工具的 AI 答案更糟糕。

但谷歌能做到一些这些工具做不到的事情——它能够给大家提供来自独立创作者和博主的准确、及时、原创的新闻内容。

谷歌自 2002 年以来就运营着一个新闻部门，拥有数十年的新闻内容理解经验。而许多新闻机构明确阻止 Perplexity 之类的 AI 聊天机器人抓取他们的内容，但几乎所有人都欢迎谷歌的爬虫，因为大家都想要从谷歌搜索引擎获取高价值的自然流量。

这种广泛的访问权限让谷歌拥有一个独特的突发新闻数据库可通过。而它的 AI 竞争对手由于缺乏这种访问权限，自然就错过了这些数据。

从这次更新的官方目标来看，谷歌似乎终于意识到，自己几十年的经验和庞大的数据储备给了它巨大的竞争优势。

去年，谷歌甚至邀请了 20 位博主前往其山景城总部，向他们取经，探讨如何更好地支持独立创作者。几位参会者离开后都表示，他们感觉谷歌终于开始认认真真地对待创作者内容的问题了。

当然，谷歌绝不会完全放弃 AI 生成的内容。AI 概览的经济效益——让用户留在谷歌自己的平台上，而不是引导他们前往外部网站——实在是太诱人了，不可能被忽视。

但它很有可能会做的事情是，开始加强（甚至替换）新闻相关查询中的 AI 概览，改用原创创作者内容。

对于创作者来说，信息已经很明确了——如果你想在谷歌上获得好的排名（以及在较小程度上，在 Bing 这样的传统搜索引擎上），你应该减少对常规信息类内容的关注，而更多地专注于新闻。

至关重要的是，新闻内容不一定要是关于本地事件、政治公告或其他传统的“硬新闻”话题（尽管这一些内容确实表现良好）。你可以在任何领域或主题中找到符合的新闻内容。

比如，一个美食创作者可以报道当前流行的新食材。例如，“迪拜巧克力”最近正在流行，关于它的报道可完全归入“新闻”类别。

这一点再次对创作者有利。许多独立创作者对自己所关注的领域充满热情，他们真的亲身去参加了，实际观察、发现新事物。

AI 也许能很好地总结不一样的编织针，但它没办法亲自去手工艺展会，发现编织领域的新趋势（比如智能纺织品和导电纱线），并在当天就带回报道，附上专家评论和分析。

长期以来，作为一名内容创作者，感觉就像是在把自己变成一台机器——写那些毫无生气的 3000+ 字“信息型”文章，话题来源全靠关键词研究工具。

而新闻内容则完全相反。它充满了许多活力，它让你走向世界。你可以用更吸引人、更有冲击力的方式写作（事实上，你通常必须这样做）。你能够迅速尝试新事物，当某个尝试失败时也能轻松放手——毕竟，明天总会有新的新闻可以报道。

上一篇:中原环保推出CPEP数字化无感计量称重系统开启智能计量新篇章
下一篇:共享7套大气税收宣扬月活动PPT模板适当有用！

产品中心