低调上线,热度不减
DeepSeek最新发布了V3.1版本,这款685亿参数的模型在没有详细说明文档的情况下,迅速登上Hugging Face热门榜第四位。凭借8万+的关注者基础,DeepSeek在开源AI社区的影响力可见一斑。
性能提升明显
编程能力表现优异
在最新的aider测试中,DeepSeek V3.1取得了71.6%的成绩,创下非推理模型的最佳记录。这一表现显示了其在代码生成和编程辅助方面的实用价值。
功能升级
相比V3基础版本,V3.1新增了四个特殊标记:
- 搜索功能标记:
<|search▁begin|>
和<|search▁end|>
- 思考过程标记:
<think>
和</think>
下面是token对应的id
<|search▁begin|> (id: 128796)
<|search▁end|> (id: 128797)
<think> (id: 128798)
</think> (id: 128799)
这些功能的激活意味着模型具备了更强的推理和信息检索能力。
技术特点
新版本支持多种数据格式(BF16、F8_E4M3、F32),提供了更长的上下文窗口,能够处理更复杂的任务场景。目前模型已在Hugging Face平台开放下载,API服务预计将陆续推出。
市场影响
DeepSeek V3.1的发布为AI开发者提供了新的选择,其开源策略和相对较低的使用成本(约1美元)为更多用户降低了AI应用的门槛。随着API服务的完善,预计将在编程辅助和智能对话领域产生更大影响。
关注获取更多AI技术动态