1. Test-Time Compute(测试时计算)
在深入了解 DeepSearch 和 DeepResearch 之前,我们得先搞明白一个概念: Test-Time Compute (测试时计算)。其实,很多功能的设计都是围绕着 Test-Time Compute 来展开的。
这个概念最早是 OpenAI 在去年 9 月发布的 “o1-preview” 模型中提到的。它的核心思想是,与其在模型的预训练和微调阶段投入大量资源,不如在推理阶段(Reasoning)集中精力进行高级处理。
Test-Time Compute(TTC)是指当一个 AI 模型在训练完成后,实际执行任务或生成回应时所需要的计算资源和时间。简单来说,就是模型在实际使用时的计算需求,而不是在训练阶段的需求。
Test-Time Compute(TTC)的几个关键点:
- 推理过程 :当你向模型输入问题或提示时,它会处理输入并生成回应。这个处理的计算成本就叫做 Test-Time Compute。
- 推理阶段的扩展 :一些先进的 AI 模型,比如 OpenAI 的 o1 系列,在推理过程中会根据需要动态增加思考时间。也就是说,它们可以在面对复杂问题时花更多时间思考,从而提高准确性,但也需要消耗更多的计算资源。
通过在推理阶段投入更多计算资源,o1 模型能够进行更深入的推理,从而提供更准确、更有深度的回答。o1 使用的是一步步思考的方式,也就是 Chain-of-Thought 方法,最终得出一个结论。因此,o1 模型在解决复杂问题时非常有优势。
举个例子,如果让模型执行类似 Chain-of-Thought(思维链)的“边思考边推理”过程,最终的输出质量可以显著提升。虽然这个过程会消耗更多时间,但随着大语言模型(LLM)越来越普及,用户也渐渐习惯了等待模型思考。只要结果足够好,大家也能接受稍长的等待时间。
想了解更多关于 Test-Time Compute 的内容,可以参考 Hugging Face 这篇文章:
https://huggingface.co/blog/Kseniase/testtimecompute#/
2. 什么是 DeepSearch
DeepSearch 可以理解为一种“高级的网页搜索代理”。传统的网页搜索代理通常只是用已有的搜索工具来收集信息,然后生成答案,它基本上只进行了一次搜索。而 DeepSearch 则在搜索过程中加入了“推理”这一环节。
简而言之, DeepSearch 的工作原理是不断地进行“搜索 → 推理 → 搜索 → 推理…”的循环,直到找到最合适的答案,或者达到 Token 限制为止。
下图展示了 DeepSearch 和传统网页搜索代理的处理流程对比。DeepSearch 的最大特点就是它通过多次搜索和推理的过程,最终得出更准确的答案。
3. 什么是 DeepResearch
另外, DeepResearch 可以看作是 DeepSearch 的一个典型应用案例 。它的主要目标是“自动生成研究报告”。用户只需要提供一个主题,DeepResearch 就会首先规划出报告的大致章节结构。接着,针对每个章节,DeepResearch 会利用 DeepSearch 进行信息搜索和推理。最后,借助大语言模型(LLM)整理和整合这些信息,最终生成完整的研究报告。
4. DeepSearch vs DeepResearch
最后,我们来简单总结一下 DeepSearch 和 DeepResearch 之间的关系和区别。简单来说, DeepSearch 是一种即将成为主流的全新 AI 搜索方法,而 DeepResearch 则是基于 DeepSearch 的一种典型应用。 写研究报告通常是件非常耗时的事,但随着越来越多的 AI 服务推出 DeepResearch 功能,未来我们可能只需要短时间就能生成高质量的报告。
虽然 DeepSearch 的处理时间可能稍微长一些,但如果它能够通过深入的信息收集和推理,提供高质量的结果,相信用户是可以接受的。
另外,LangChain,Jina等最近也开源了他们自己实现的 DeepResearch,感兴趣的朋友可以通过以下链接尝试下。
-
https://github.com/langchain-ai/open\_deep\_research?tab=readme-ov-file#/
-
https://github.com/zilliztech/deep-searcher
添加微信,备注” LLM “进入大模型技术交流群
如果你觉得这篇文章对你有帮助,别忘了点个赞、送个喜欢
/ 作者:致Great
/ 作者:欢迎转载,标注来源即可