今天,反击DeepSeek开始, OpenAI在ChatGPT中推出了 Deep Research 功能,新一代的 Agentic 能力,能够在 互联网 上为 复杂任务进行多步骤 的研究。 它适合需要 深度和细节 的多方面、特定领域的查询 。
特别的,
在“人类终极考试(
Humanity's Last Exam )”中OpenAI将 智能体 Deep Research( 联网+python工具 )与当前火热的 模型 DeepSeek-R1( 非多模态,仅在文本子集进行评估 )进行了对比:
Deep Research模型的准确率达到了新的高度,为26.6%,是DeepSeek-R1的近三倍(9.4%) 。
该测试包含超过3000道多项选择题和简答题,涵盖从语言学到火箭科学、古典学到生态学等100多个学科领域
而 谷歌 早在几个月前就发布了 AI助理Deep Research ,这才是OpenAI Deep Research需要对标的竞品。
谷歌Deep Research是Gemini 2.0高级版中一个Agent功能,用于探索 复杂主题 (文献调研、方案优化),并提供全面且易于阅读的报告,特别适合科研人员和工程师, 与OpenAI Deep Research定位接近 。
OpenAI Deep Research技术要点:
- Deep Research是通过端到端强化学习,在多个领域的复杂浏览和推理任务中进行训练的。
- Deep Research 由即将发布的 OpenAI o3模型 的一个优化版本提供支持,该版本专门用于网络浏览和数据分析。
- Deep Research 利用推理能力在互联网上搜索、解读和分析大量的文本、图像和PDF文件,并根据遇到的信息灵活调整方向。
使用Python工具绘制和迭代图表,将生成的图表和网站上的图片嵌入其回答中,并引用其来源中的具体句子或段落。
领域(化学、语言学、医疗保健)专家级别示例: Deep Research 已经实现了多个小时复杂手动调查的自动化。
https://openai.com/index/introducing-deep-research/
推荐阅读
- • 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
- • DeepSeek R1/o1大型推理模型蓝图:架构设计及快速原型实现框架x1
- • RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!
- • Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。