智谱开源,深度思考、deepresearch模型。

大模型向量数据库云通信

智谱开源。GLM-4-32B-0414 系列,性能与 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列相当,且包含了一个具有深度思考的deepresearch能力的模型。

picture.image

  • GLM-Z1-32B-0414 是一个具有深度思考能力的推理模型,效果比肩 OpenAI 的 GPT 系列和 DeepSeek 的 V3/R1 系列。

picture.image

  • GLM-Z1-9B-0414 是个惊喜。尽管规模较小,GLM-Z1-9B-0414 在数学推理和通用任务中依然展现出极为优秀的能力。

picture.image

  • GLM-Z1-Rumination-32B-0414 是一种具有沉思能力的深度推理模型(对标 Open AI 的 Deep Research)。不同于一般的深度思考模型,沉思模型通过更长时间的深度思考来解决更开放和复杂的问题(例如:撰写两个城市AI发展对比情况,以及未来的发展规划),沉思模型在深度思考过程中结合搜索工具处理复杂任务,并经过利用多种规则型奖励来指导和扩展端到端强化学习训练得到。Z1-Rumination 在研究型写作和复杂检索任务上的能力得到了显著提升。

Z1-Rumination 注:

  • 不支持自定义系统提示词,不支持自定义工具,你的所有 tools 和 system 字段会被 apply_chat_template 忽略。使用该模型需要外接搜索引擎或者自定义retrieval API。
  • 一共支持四个工具,分别是
  
    1. search  
   描述: 执行搜索查询并返回搜索结果。当您需要查找有关特定主题的信息时使用此功能。  
   参数: query (字符串) - 搜索查询字符串,除非是中文专有名词,否则使用英文单词  
  
2. click  
   描述: 点击搜索结果中的链接并导航到相应页面。当您需要查看特定搜索结果的详细内容时使用此功能。  
   参数: link\_id (整数) - 要点击的链接ID(来自搜索结果中的序号)  
  
3. open  
   描述: 打开特定网站。通过URL获取任何网站的内容。  
   参数: url (字符串) - 目标网站URL或域名  
  
4. finish  
   描述: 完成任务。当您已找到所需信息时使用此功能。  
   参数: 无  

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
云原生机器学习系统落地和实践
机器学习在字节跳动有着丰富业务场景:推广搜、CV/NLP/Speech 等。业务规模的不断增大对机器学习系统从用户体验、训练效率、编排调度、资源利用等方面也提出了新的挑战,而 Kubernetes 云原生理念的提出正是为了应对这些挑战。本次分享将主要介绍字节跳动机器学习系统云原生化的落地和实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论