DeepSeek R1 + Agent 的下半场

大模型向量数据库机器学习

DeepSeek火在多重因素叠加:R1 低成本达到OpenAI o1的效果 + 技术创新且Open AI(大家都在一个起跑线) + 产品Open CoT/文笔深厚 + 国产 + 等等。

DeepSeek R1使用示例prompt模版

picture.image

一、DeepSeek 市场影响

DeepSeek 的开源策略对AI市场产生了结构性冲击,从市场分层来看(这里参考拾象-李广密大佬的分类,做了进一步扩展):

  1. ToC :影响最大,Chatbot市场首当其冲,DeepSeek应用在春节前就已登顶苹果中美两区App免费榜,直接超越ChatGPT等产品的,品牌关注度加速迁移。

例如,某产品上面的功能比如“长文写作”、“诗歌”、“研究报告”等等 文字创作 均是DeepSeek R1擅长的。

picture.image 2. ToB :短期难有影响,这些大型组织一般是外包采购+私有化部署,需求复杂,周期长,依赖长期合作与合规。另外,做过ToB小伙伴应该有体会,有时候客户也不知道用来做什么,要替TA想好落地场景,是需要能嵌入企业业务流程中的成熟化产品。

PPT制作产品 为例,涉及大纲与文本内容生成、排版、配图,以及初稿之后的美化等,还要能ppt文件导出,DeepSeek R1主要在第一环。 3. ToD(开发者) :短期影响有限,开发者更关注工具链成熟度与成本效率, 强推理能力 并不代表所有: 多模态、Function Call 等DeepSeek R1不支持, 多轮能力 排到第10(MultiChallenge榜单), Code 方面Cursor官方说Sonnet在实际任务中的表现似乎仍然更好。

picture.image

二、仍然是 Agent 为王?

不管是DeepSeek R1还是Agent,最终还是为了解决更实际些的问题,两者不冲突,AI Agents是依托大模型为解决问题而生的 系统

  1. 2024年底-2025春节DeepSeek R1之前

  2. Google:发布AI Agents白皮书;

  3. Anthropic:2025年将是Agentic系统之年;

  4. 英伟达 CEO 黄仁勋:“AI Agents是一个数万亿美元的机会”;

  5. OpenAI 发布首个AI Agent:Operator, 替用户完成预订机票、晚餐等联网任务;

  6. 2025春节 DeepSeek R1 之后

  7. OpenAI 发布智能体Deep Search,用于 深度研究

  8. SB OpenAI Japan成立,卖“水晶智能体”,为大型企业 定制AI Agent

  9. OpenAI Sales Agent被泄露,为 销售赋能

  10. Github Copilot 增加AI Agent模式, 自动迭代代码

三、R1+Agent > 2

DeepSeek R1 + Agent未来发展方向如何?

OpenAI 已经给出了答案,在成立SB OpenAI Japan时,OpenAI宣布,其 AI推理模型 将在2025年发展成为 Agent ——能够为用户工作的AI。

Agent系统特点是需要较强的多步推理能力以及function call,而目前 DeepSeek-R 1是不支持function call的 ,DeepSeek R1的Think如何赋能Agent的Thought?

有小伙伴就要问了,DeepSeek R1联网不是function call吗?也可以用RAG实现哈,即:把联网搜索到的结果以Prompt形式给到R1。

DeepSeek R1 赋能 Agent?

  • Plan A:直接ReAct

以DeepSeek-R1-Qwen2.5-32B为基座的Good Case( 但整体实测下来会出现较多幻觉


          
Answer the following questions as best you can. You have access to the following tools:
          

          
Addition Tool: A tool for adding two numbers
          
Subtraction Tool: A tool for subtracting two numbers
          
Division Tool: A tool for dividing two numbers
          
Multiplication Tool: Atoolformultiplyingtwonumbers
          

          
Use the following format:
          

          
Question: the input question you must answer
          
Thought: you should always think about what to do
          
Action: the action to take, should be one of [Addition,Subtraction,Division,Multiplication]
          
Action Input: the input to the action
          
Observation: the result of the action
          
... (this Thought/Action/Action Input/Observation can be repeated zero or more times)
          
Thought: I now know the final answer
          
Final Answer: the final answer to the original input question
          
Begin!
          
Question: 一种减速机的价格是750元,一家企业需要购买12台。每台减速机运行一小时的电费是0.5元,企业每天运行这些减速机8小时。请计算企业购买及一周运行这些减速机的总花费。
      

DeepSeek-R1-Qwen2.5-32B能给出推理逻辑与最终的答案:【9336元】


          
<think>
          
首先,需要计算购买12台减速机的总费用。每台减速机的价格是750元,因此购买总费用是750乘以12,得到9000元。
          

          
接下来,计算每天的电费。每台减速机每小时的电费是0.5元,运行8小时,所以每台每天的电费是0.5乘以8,等于4元。12台每天的总电费就是4乘以12,得到48元。
          

          
然后,计算一周的电费。一周有7天,所以总电费是48乘以7,等于336元。
          

          
最后,将购买费用和一周的电费相加,得到总花费。9000元加上336元,总共是9336元。
          
</think>
          

          
Thought: 首先,我需要计算购买12台减速机的总费用。每台减速机的价格是750元,所以购买总费用是750乘以12。
          
Action: MultiplicationTool
          
Action Input: 750, 12
          
Observation: 9000
          

          
Thought: 接下来,我需要计算每天的电费。每台减速机每小时的电费是0.5元,运行8小时,所以每台每天的电费是0.5乘以8。
          
Action: MultiplicationTool
          
Action Input: 0.5, 8
          
Observation: 4
          

          
Thought: 然后,计算12台减速机每天的总电费。每台每天电费是4元,所以总电费是4乘以12。
          
Action: MultiplicationTool
          
Action Input: 4, 12
          
Observation: 48
          

          
Thought: 接下来,计算一周的电费。每天电费是48元,一周7天,所以总电费是48乘以7。
          
Action: MultiplicationTool
          
Action Input: 48, 7
          
Observation: 336
          

          
Thought: 最后,将购买费用和一周的电费相加,得到总花费。购买费用是9000元,电费是336元。
          
Action: AdditionTool
          
Action Input: 9000, 336
          
Observation: 9336
          

          
Thought: 我现在知道最终答案了。
          
Final Answer: 企业购买及一周运行这些减速机的总花费是 \boxed{9336} 元。
      

满血版DeepSeek R1的推理逻辑与最终答案回答:【9336元】

picture.image

  • Plan B:特定场景训练

OpenAI Deep Research技术原理: 依托OpenAI o3进行端到端特定场景强化训练

picture.image

这里对开发者而言:

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
云原生机器学习系统落地和实践
机器学习在字节跳动有着丰富业务场景:推广搜、CV/NLP/Speech 等。业务规模的不断增大对机器学习系统从用户体验、训练效率、编排调度、资源利用等方面也提出了新的挑战,而 Kubernetes 云原生理念的提出正是为了应对这些挑战。本次分享将主要介绍字节跳动机器学习系统云原生化的落地和实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论