解锁的搜索与推理新模式:DeepSearch与DeepResearch的区别

大模型向量数据库数据中台

1. Test-Time Compute(测试时计算)

在深入了解 DeepSearch 和 DeepResearch 之前,我们得先搞明白一个概念: Test-Time Compute (测试时计算)。其实,很多功能的设计都是围绕着 Test-Time Compute 来展开的。

这个概念最早是 OpenAI 在去年 9 月发布的 “o1-preview” 模型中提到的。它的核心思想是,与其在模型的预训练和微调阶段投入大量资源,不如在推理阶段(Reasoning)集中精力进行高级处理。

Test-Time Compute(TTC)是指当一个 AI 模型在训练完成后,实际执行任务或生成回应时所需要的计算资源和时间。简单来说,就是模型在实际使用时的计算需求,而不是在训练阶段的需求。

Test-Time Compute(TTC)的几个关键点:

  1. 推理过程 :当你向模型输入问题或提示时,它会处理输入并生成回应。这个处理的计算成本就叫做 Test-Time Compute。
  2. 推理阶段的扩展 :一些先进的 AI 模型,比如 OpenAI 的 o1 系列,在推理过程中会根据需要动态增加思考时间。也就是说,它们可以在面对复杂问题时花更多时间思考,从而提高准确性,但也需要消耗更多的计算资源。

通过在推理阶段投入更多计算资源,o1 模型能够进行更深入的推理,从而提供更准确、更有深度的回答。o1 使用的是一步步思考的方式,也就是 Chain-of-Thought 方法,最终得出一个结论。因此,o1 模型在解决复杂问题时非常有优势。

举个例子,如果让模型执行类似 Chain-of-Thought(思维链)的“边思考边推理”过程,最终的输出质量可以显著提升。虽然这个过程会消耗更多时间,但随着大语言模型(LLM)越来越普及,用户也渐渐习惯了等待模型思考。只要结果足够好,大家也能接受稍长的等待时间。

想了解更多关于 Test-Time Compute 的内容,可以参考 Hugging Face 这篇文章:

https://huggingface.co/blog/Kseniase/testtimecompute#/

2. 什么是 DeepSearch

DeepSearch 可以理解为一种“高级的网页搜索代理”。传统的网页搜索代理通常只是用已有的搜索工具来收集信息,然后生成答案,它基本上只进行了一次搜索。而 DeepSearch 则在搜索过程中加入了“推理”这一环节。

简而言之, DeepSearch 的工作原理是不断地进行“搜索 → 推理 → 搜索 → 推理…”的循环,直到找到最合适的答案,或者达到 Token 限制为止。

下图展示了 DeepSearch 和传统网页搜索代理的处理流程对比。DeepSearch 的最大特点就是它通过多次搜索和推理的过程,最终得出更准确的答案。

3. 什么是 DeepResearch

另外, DeepResearch 可以看作是 DeepSearch 的一个典型应用案例 。它的主要目标是“自动生成研究报告”。用户只需要提供一个主题,DeepResearch 就会首先规划出报告的大致章节结构。接着,针对每个章节,DeepResearch 会利用 DeepSearch 进行信息搜索和推理。最后,借助大语言模型(LLM)整理和整合这些信息,最终生成完整的研究报告。

4. DeepSearch vs DeepResearch

最后,我们来简单总结一下 DeepSearch 和 DeepResearch 之间的关系和区别。简单来说, DeepSearch 是一种即将成为主流的全新 AI 搜索方法,而 DeepResearch 则是基于 DeepSearch 的一种典型应用。 写研究报告通常是件非常耗时的事,但随着越来越多的 AI 服务推出 DeepResearch 功能,未来我们可能只需要短时间就能生成高质量的报告。

虽然 DeepSearch 的处理时间可能稍微长一些,但如果它能够通过深入的信息收集和推理,提供高质量的结果,相信用户是可以接受的。

另外,LangChain,Jina等最近也开源了他们自己实现的 DeepResearch,感兴趣的朋友可以通过以下链接尝试下。

  • https://github.com/langchain-ai/open\_deep\_research?tab=readme-ov-file#/

  • https://github.com/jina-ai/node-DeepResearch

  • https://github.com/zilliztech/deep-searcher

picture.image

添加微信,备注” LLM “进入大模型技术交流群

picture.image

picture.image

如果你觉得这篇文章对你有帮助,别忘了点个赞、送个喜欢

/ 作者:致Great

/ 作者:欢迎转载,标注来源即可

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论