竟用智能体DeepResearch对比DeepSeek R1模型，OpenAI急了？ - 文章 - 开发者社区

今天，反击DeepSeek开始， OpenAI在ChatGPT中推出了 Deep Research 功能，新一代的 Agentic 能力，能够在 互联网 上为 复杂任务进行多步骤 的研究。它适合需要 深度和细节 的多方面、特定领域的查询。

picture.image

特别的，

在“人类终极考试（

Humanity's Last Exam ）”中OpenAI将 智能体 Deep Research（ 联网+python工具 ）与当前火热的模型 DeepSeek-R1（ 非多模态，仅在文本子集进行评估 ）进行了对比：

Deep Research模型的准确率达到了新的高度，为26.6%，是DeepSeek-R1的近三倍（9.4%） 。

该测试包含超过3000道多项选择题和简答题，涵盖从语言学到火箭科学、古典学到生态学等100多个学科领域

picture.image

而谷歌早在几个月前就发布了 AI助理Deep Research ，这才是OpenAI Deep Research需要对标的竞品。

谷歌Deep Research是Gemini 2.0高级版中一个Agent功能，用于探索 复杂主题 （文献调研、方案优化），并提供全面且易于阅读的报告，特别适合科研人员和工程师， 与OpenAI Deep Research定位接近 。

picture.image

OpenAI Deep Research技术要点：

使用Python工具绘制和迭代图表，将生成的图表和网站上的图片嵌入其回答中，并引用其来源中的具体句子或段落。

领域（化学、语言学、医疗保健）专家级别示例： Deep Research 已经实现了多个小时复杂手动调查的自动化。

picture.image


          
              

            https://openai.com/index/introducing-deep-research/