DeepSeek V3.1发布!

大模型机器学习数据库

picture.image

低调上线,热度不减

DeepSeek最新发布了V3.1版本,这款685亿参数的模型在没有详细说明文档的情况下,迅速登上Hugging Face热门榜第四位。凭借8万+的关注者基础,DeepSeek在开源AI社区的影响力可见一斑。

picture.image

性能提升明显

编程能力表现优异

在最新的aider测试中,DeepSeek V3.1取得了71.6%的成绩,创下非推理模型的最佳记录。这一表现显示了其在代码生成和编程辅助方面的实用价值。picture.image

功能升级

相比V3基础版本,V3.1新增了四个特殊标记:

  • 搜索功能标记: <|search▁begin|><|search▁end|>
  • 思考过程标记: <think></think>

下面是token对应的id

  
<|search▁begin|> (id: 128796)  
<|search▁end|> (id: 128797)  
<think> (id: 128798)  
</think> (id: 128799)

这些功能的激活意味着模型具备了更强的推理和信息检索能力。

技术特点

新版本支持多种数据格式(BF16、F8_E4M3、F32),提供了更长的上下文窗口,能够处理更复杂的任务场景。目前模型已在Hugging Face平台开放下载,API服务预计将陆续推出。

picture.image

市场影响

DeepSeek V3.1的发布为AI开发者提供了新的选择,其开源策略和相对较低的使用成本(约1美元)为更多用户降低了AI应用的门槛。随着API服务的完善,预计将在编程辅助和智能对话领域产生更大影响。

picture.image


关注获取更多AI技术动态

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论