各大公司竞相将生成式人工智能融入搜索引擎,希望彻底改变用户获取信息的方式。然而,这一未知领域面临着重大挑战:确保人工智能生成的搜索结果的准确性和可靠性。随着人工智能模型努力应对“幻觉”——生成的内容用不准确的信息填补空白——该行业面临着一个关键问题:我们如何才能充分利用人工智能的潜力,同时最大限度地减少错误信息的传播?
谷歌的新型生成式人工智能搜索工具最近让用户大吃一惊,因为它建议用户吃石头。尽管如此,该公司告诉 BBC,该功能总体表现相对较好。
谷歌在给新闻社的一份声明中表示:“我们看到的例子通常都是非常不常见的查询,并不代表大多数人的经历。”“绝大多数人工智能概述都提供了高质量的信息,并提供了在网络上深入挖掘的链接。”
此次事件凸显了搜索技术目前的局限性。AI 概览功能由 Gemini 提供支持,Gemini 是一种大型语言模型,类似于 OpenAI 的 ChatGPT,它通过总结在线信息来生成对特定搜索查询的书面回复。虽然当前的 AI 热潮利用了 LLM 在文本生成方面的出色能力,但该软件也可以利用这种能力令人信服地呈现不准确或错误。
生成式人工智能可以通过总结信息来简化在线搜索结果。然而,当信息来源不一致或人们使用人工智能总结做出重要决定时,这可能会带来风险。
随着人工智能搜索引擎的快速发展,研究人员正试图通过消除不准确性、对抗偏见和提高透明度来提高其可靠性。从教人工智能何时承认不确定性到优先考虑训练数据的多样性,这些专家正在探索创新解决方案,以建立信任并为用户可以放心依赖的搜索体验铺平道路,尽管他们承认仍有重大进展需要取得。
该领域的学者和科学家对我们如何走到今天这一步以及进步的道路是什么样的进行了探讨。
内在困境:新颖性与准确性
问题的核心在于生成式人工智能的根本性质及其卓越的用例。研究人员已经探索了当生成式人工智能被设计为创造新颖的内容而不是提供事实答案时出现的权衡。宾夕法尼亚大学工程学教授罗伯特·格里斯特 (Robert Ghrist) 说:“使用 ChatGPT 进行互联网搜索就像使用钻头敲钉子:它可能有效,但为什么要这样做?”当用户以谷歌搜索的方式向生成式人工智能提出问题时,人工智能可能会生成不基于现实的回答,从而导致幻觉现象。
伊利诺伊大学格兰杰工程学院电气与计算机工程教授 Deming Chen 警告称,人工智能模型可能会过度概括其训练数据并得出不符合事实的答案。他还指出,人工智能所训练的事实可能在模型训练完成后已经发生了变化或快速发展。
“另一个主要原因是,由于某些小众主题的数据有限或没有数据,人工智能模型可能会推断出看似正确但并非基于事实的信息,”他说,并补充说,这种幻觉可能导致错误信息的传播、信任的侵蚀和决策错误。
软件开发公司 Aimprosoft 的数据科学家 Dmytro Shevchenko 表示,问题进一步加剧,“神经网络(例如 LLM)的架构和大小选择不够理想,而这对模型处理和解释数据的能力起着关键作用”。他解释说,当一个经过大量数据训练的模型生成看似合理但实际上不正确的信息时,就会出现幻觉,如果用户盲目信任人工智能的回答,就会导致进一步的问题。
探索 AI 解决方案
提高人工智能搜索准确性
科技公司正在探索多种途径来改进人工智能搜索,从比较不同的查询结果到微调支持这些系统的数据和公式。舍甫琴科建议,“公司可以改进模型架构,使用更复杂、更合适的模型架构,以及让模型更好地适应各种数据和使用场景的方法。”
一种有前途的方法是将人类专业知识和情境感知、基于事实的知识数据库整合到人工智能搜索过程中。诸如从人类反馈中强化学习 (RLHF) 和检索增强生成 (RAG) 等技术为更准确、更可靠的人工智能搜索结果提供了潜在的解决方案。舍甫琴科强调了专家参与的重要性,并指出“让专家参与评估和改进模型结果的过程至关重要。”
研究人员正在解决不准确和不明确的结果,以提高人工智能搜索的可靠性。最近的一项研究发现了 32 种不同的方法可以减少人工智能语言模型中的幻觉,这些方法都是在过去几年内创建的。这包括教人工智能在不确定的情况下何时应避免给出答案。
偏见是另一个问题。华盛顿大学的 Shahan Ali Memon 和 Jevin D. West 最近撰写了一篇关于减少人工智能系统偏见的项目的重要性的文章。一个值得注意的例子是一项名为 Latimer 或 Black GPT 的计划,旨在在训练人工智能时强调多样性和包容性。
“生成式人工智能有可能将我们当前的信息生态系统转变为巴别图书馆的当代版本,”Memon 和 West 写道。“在这个新版本中,会有无数的文本,混合着真相和虚构,但更糟糕的是,它们将被剥去外衣,从而掩盖信息的出处和来源。搜索引擎是我们通往互联网的大门——类似于数字图书管理员——往往会产生幻觉并产生虚构的故事。在这个世界上寻找可靠的信息就像徒劳无功,只不过这些鹅穿着溜冰鞋。”
随着科技公司继续应对人工智能搜索准确性的挑战,充分发挥生成式人工智能潜力的旅程还远未结束。然而,每次失败都是一次学习机会。正如 Ghrist 所说,“你今天使用的人工智能将是你即将拥有的最糟糕的人工智能。”
下载电子书:面向企业的生成式 AI + ML
本文是否有帮助?
是的不