大模型逐鹿AI搜索,「天工」跑在了前面

时间:2024-08-22 阅读:9 评论:0 作者:admin

由机器的心脏报告

《机器之心》编辑部

颠覆数字世界的根基,大模型应用的第一波浪潮来了?

近期,科技领域的新品都注重“大模的加持”,技术竞争进入白热化,无论是谷歌、Microsoft还是Meta,似乎都瞬间回归了青春。

随着技术的飞速发展,越来越多的人开始讨论大模型的应用。在地面上,首当其冲的是谷歌一直主导的搜索。

ChatGPT发布后不久,在第一波浪潮中占据先风的Microsoft,发布了一款大模型应用产品,那就是搜索引擎。北京时间2月8日凌晨,Microsoft发布了一则重大公告,争分夺秒地宣布将大模型技术引入自己的搜索引擎。

这一次,一直处于主导地位的谷歌搜索,感受到了Microsoft新Bing带来的“冲击”,也让我们看到,AI搜索引擎已经成为大模型技术应用的战略要地。

近日,国内昆仑万维企业加入“AI搜索引擎”之战,宣布推出国内首个融入大语言模型的搜索引擎——天宫AI搜索,并开放内测应用并上线App。

封闭测试链接:tiangong.cn

在这篇文章中,让我们来看看天宫AI搜索如何挑战传统搜索。使用的实际效果如何?

为什么要从搜索开始?

早早发布“天宫”大语种模型的昆仑万维,为何将大模型技术的第一款产品放在搜索引擎场景的C端?

究其原因,在于搜索的重要性,以及大规模模型技术带来的创新潜力。

由于技术的快速迭代,许多科技公司都提出了“基础模型”,开发者可以在此基础模型上根据自己的需求构建商业应用,但基于这些模型的大规模产业转型尚未实现。

但在消费领域,生成式AI似乎有着更明显的未来。自今年2月以来,Microsoft、OpenAI、Google、百度等先锋们的举动,似乎受到了人们的欢迎,将大模型的力量引入到自己的搜索引擎中。

随着大模型时代的到来,我们的生活将发生怎样的变化?在看到ChatGPT的震撼效果后,我们都曾认真或夸张地想象过它,并且有一个共识,那就是它可能在科技公司的产品中无处不在,需要与计算机交互的工作越多,破坏力就会越强。

在与计算机交互的过程中,搜索引擎是基本的和“非敏感”的应用程序。长期以来,搜索的形态几乎没有什么重大变化,人们越来越倾向于选择排名靠前的几大服务。

在大模型出现后,传统搜索可能会被颠覆,而这种模式也有机会被打破:通过结合AI技术发生质变后,过去从关键词开始的搜索动作,变成了“让人工智能来做工作”的指令,我们不再需要思考搜索的方式, 或者繁琐地过滤搜索结果中可能有用的内容或条目,人工智能将一站式解决问题。

通过大型模型独特的思维链 (CoT) 功能,下一代搜索系统可以全面理解人们提出的问题和他们找到的内容,分析您的意图,并持续有效地与您互动以生成有意义的内容。

简单来说,AI现在有了一点“逻辑”,它真的可以作为我们的个人助理,因为它满足了大量的复杂需求,成为了交通的入口,也可以作为初步的生产力工具,解决工作中的问题。

基于大模型的搜索能力,我们可以预期,在不久的将来,对信息的需求将得到极大的满足,从而使AI整合数据能够大大提高知识获取的效率,AI生成可以以以前无法想象的速度完成任务。

另一方面,一个能够完全理解人类意图的AI也可以连接到各种服务,使行程和会议纪要不再需要时间,并且随着持续使用,它会变得越来越智能。

如果存在这样大规模的模型应用,不就是我们心目中、能帮我们应对世界的“超级应用”吗?

全AI搜索体验,更便捷

既然产品已经上线了,效果如何呢?

作为首批参与内测的用户之一,心机首次尝试了天宫AI搜索的质量。经过一些经验,我们真的感受到了与传统搜索引擎的不同。

这款APP叫“天宫AI助手”,新用户可以通过下载来体验,如果是老用户,只需要更新APP即可体验。它的用户界面设计得很简单:只需在搜索框中点击它,然后提出你想知道的任何问题。此外,借助“AI对话”功能,您还可以体验与天宫的AI助手聊天和交互的能力,并创建文本等常规的大模型。

众所周知,传统的搜索引擎主要是以关键词为导向的,在输入文本后,我们会得到大量与关键词匹配的结果,这些结果按照相关性顺序排列(不考虑广告)。但这种方法可能并不总是给你真正想要的答案,毕竟即使是论文也有标题派对,如果你搜索很长的段落,搜索引擎很少会考虑输入的逻辑。

天宫AI搜索主打自然语言搜索,就是用白话提问,不用单词造句,也不使用信息检索课上提到的“算子”,想问多少就问多少。天宫AI搜索不仅便于分析并获取您的真实意图,而且还能捕捉问题中的上下文关系,使搜索结果更加准确和相关。

也极大地改变了搜索引擎输出结果的逻辑,可以看到天宫AI搜索的界面从上到下分为三个部分,分别是参考、回答和跟进。

这就是天宫AI搜索与传统搜索的不同之处:它首先展示一个参考信息的来源,而这些来源对于回答问题最有价值;然后,基于AI大模型能力,对参考内容进行汇总,去除多余、不相关的信息,更高效、准确地生成简洁明了的答案。

作为在搜索结果(答案)中引用信息源的参考,是天宫AI搜索的第一大亮点。这些列出的参考资料确保了答案的可追溯性和可信度,相应的索引为您提供了原始信息的直接链接。还有丰富的参考信息来源,不仅包括新闻网站、知识问答平台,还包括机构的官方网站和视频。

底部是天宫AI搜索的“跟进”功能,体现了搜索引擎大模型的一面,让你可以围绕一个问题进行20+轮的深度互动。

搜索引擎的特点是可以根据您的需求输出即时准确的信息,而大模型的优势在于它们打破了人与机器之间的壁垒,可以有效地与您进行对话,充分理解上下文内容,并给出准确的回应。

接下来,我想了解一下 Google 2017 年的工作,它影响了自然语言处理 (NLP) 的方向。天宫AI搜索给出了这篇论文的标题、架构原理和影响,就像是这篇论文的总结。

继续追问,在NLP领域高曝光的Transformer,早已扩展到计算机视觉领域。谷歌在视觉转换器领域的工作 视觉转换器有什么了不起的地方?天宫AI搜索让我们了解到ViT相对于传统卷积和递归神经网络的优势,更好的建模能力和更强的可解释性,以及它给计算机视觉领域带来的积极影响。

写《变形金刚》这篇论文的作者现在被认为是神,对吧?然后继续前进。

可以看出,天宫AI搜索的无限追问,赋予了你我“破锅、追问到底”的能力,一件事情的来龙去脉都能在其中找到。

除了让你通过提问成为“万事通”外,天宫AI搜索还拥有强大的信息整合、提炼和串联能力,加上大模型的加持,让你在处理开放式问题时能更自在,有答案。

这次,我想问一个目前在大模型领域尚无定论的热点话题,开源还是闭源?看看天宫AI搜索会给我们什么答案。它的回答首先指出不能一概而论,然后详细列举了开源和闭源的优势,最后建议企业和研究机构根据自身情况选择开源或闭源,可以说是非常全面的。

大模型的搜索引擎不仅能抓到问题,还能抓到很多细节。天宫AI搜索在知识和创意搜索方面都强于传统搜索。

例如,如果你给出以下编程问题,它会先解释它,然后输出代码来实现它。当然,也列出了解决方案的源链接。

此外,您还可以根据此结果提出问题,以逐步理解此代码的原理。

让我们拿一个有创意的问题,比如我想用生成工具 Stable Diffusion 和 Runway 创作一部科幻大片,但我不知道该怎么做。天宫AI搜索给出了非常详细的准备步骤,可以看出比自己总结要快得多。

我想写一个关于海洋核污染导致人类灭绝的故事,但我不知道如何写剧本。也交给了天宫AI搜索,答案依然清晰合乎逻辑。

实时性能是搜索引擎的重要要求,天宫AI搜索在这方面表现得尤为出色,它以全网为一个数据库,保证了输出的实时输出。

例如,我想了解 Code Llama,这是 Meta 上周五发布的一个大型代码模型,也是在其基础上超越 GPT-4 的大模型。从天宫AI的搜索中,我们知道,这款超越GPT-4的大模型,就是WizardCoder 34B,以及它的首次生成通过率。

最后,关于天宫AI搜索的一个非常友好的一点是,每一轮的搜索结果都不会丢失,并且会保存在“我的历史”中,以便你随时查看搜索内容。而且,所有客户端都是统一的。

天宫大模型与AI增强技术

天宫AI搜索,看起来非常好用,背后应用了哪些技术?其最重要的支撑,是昆仑万维此前推出的千亿级大语言模型“天宫”。

作为国内首个以ChatGPT为基准的双千亿级大语言模型,“天宫”部署在中国领先的GPU集群上,集成了1000亿级预训练基础模型和1000亿RLHF模型。因此,该模型具有强大的自然语言处理和智能交互能力,在丰富的知识储备的支持下,可以满足知识问答、文案写作、逻辑推理、数学计算、代码编程等多样化的生成式AI需求。

昆仑万维表示,新一代搜索引擎利用大模型的能力,正在变得越来越智能。另一方面,基于搜索的实时内容,也降低了大模型在内容生成过程中出现幻觉等现象的概率。在天宫AI搜索的背后,昆仑万维专注于从多个角度进行提升,对传统搜索引擎的体验进行创新。

具体而言,提升主要体现在五个方面:

意图识别和理解:在传统的搜索引擎中,用户经常需要多次尝试来搜索一个陈述。天宫AI搜索会利用大模型对用户的问题进行重写后再检索,不仅可以深入挖掘用户的真实意图,还可以准确捕捉查询中的上下文关系,带来更准确、更相关的搜索结果。

智能摘要:在开放式问题中,使用“密集段落检索”(DPR) 技术对问题和可能相关的文档(例如 wiki 页面或论坛文章)进行编码,并计算相似度,以确保准确检索高度相关的文档和关键段落。

向量语义检索:昆仑万维为搜索引擎构建了大规模的实时向量检索系统,在搜索的多个环节发挥作用,包括准确内容定位、增强内容多样性、提高上下文连贯性等。通过调用用户之前查询过的搜索结果,搜索结果与用户的交互更加连贯,从而创建更自然、更流畅的搜索对话体验。

智能提问技术,为天宫AI搜索的无限提问提供支持。昆仑万维表示,该技术的核心是充分理解用户的查询,并在需要更多信息时提出问题。跟进问题的实现不仅离不开“意图识别、信息完整性检测、问题生成、用户反馈接收、动态调整学习、情境感知”等步骤,还需要对对话、用户查询日志、后续反馈等大量数据进行持续训练。当然,它也需要不断迭代和优化,通过多次准确把握用户的需求,使答案始终紧扣主题。

此外,天宫AI搜索还实现了跨语言信息检索(CLIR),即使你用中文提问,你在生成内容时寻找的信息也不仅仅是中文,而是所有的结果都被翻译和整合。这种方法不仅极大地扩展了搜索的边界,而且确保了用户能够获得最新、最全面的全球信息和研究结果。

更重要的是,天宫AI搜索会自动过滤掉付费网页和无效信息,而且没有广告,最先的是有效的参考链接。

有了这些能力,AI搜索不仅可以理解你的长而难的句子,还可以从全球网络扫描信息,整理出合乎逻辑和清晰的答案,如果你得到你的反馈,它可以继续改进。一个可以解决所有问题的一刀切的人工智能已经形成。

也许,这就是超级应用程序的开始的样子。

本文链接: http://01280.cn/2024/08/2562/ 转载请注明出处!

评论区 交流一下吧!

共有0条评论来说两句吧...

欢迎 发表评论: