大家好,我是小智,专注 AI 工具,AI 智能体和编程提效字节在AI领域可谓是全面发力,智能体、AI编程、提示词优化、文生图、图生图、多点开花,最近又悄悄发布了vLLM视觉推理大模型doubao-seed-code
doubao-seed-code简介官方介绍的比较多,咱们就不那么多废话直接看图说明一目了然
评测基准
简单说一下这些机构都是干什么的?这些测评集都是聚焦「真实可交互代码能力」的权威基准,背后的机构都是顶尖学术院校、全球科技巨头、国内头部 AI 科研机构做背书,主要的人物就是测评模型的工程落地能力,所以这些测评集提供的数据非常具有权威性和真实可靠性。此外doubao-seed-code模型+Trae这个编程助手也在SWE-Bench-Verified中登顶SOTA,真的是强强联合
功能亮点
doubao-seed-code
和其他大模型最有亮点的还是它的视觉理解和推理能力,它可以根据用户提供的截图、UI设计稿来生成代码,甚至是手绘的草图也不在话下,下面咱们逐个来测评一下。根据截图生成html代码提供一张png截图直接扔给豆包大模型
大模型直接输出html代码
<!DOCTYPE html><html lang="zh-CN"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>AI 即 Software 2.0</title> <style> /* 全局样式重置 */ * { margin: 0; padding: 0; box-sizing: border-box; font-family: Arial, sans-serif; } body { background-color: #f4f1e7; padding: 40px 20px; line-height: 1.6; } .ppt-container { max-width: 1200px; margin: 0 auto; } /* 标题区域 */ .title-section { text-align: center; margin-bottom: 50px; } .main-title { font-size: 3.5rem; font-weight: bold; color: #2c3e50; margin-bottom: 20px; } .sub-title { font-size: 1.5rem; color: #666; margin-bottom: 30px; } /* 内容模块 */ .content-section { margin-bottom: 60px; } /* 模块标题 */ .module-title { font-size: 2rem; font-weight: bold; color: #2c3e50; margin-bottom: 30px; padding-left: 15px; border-left: 4px solid #f39c12; /* 黄色左侧边框 */ } /* 卡片行布局(两列/三列) */ .card-row { display: flex; justify-content: space-around; gap: 30px; flex-wrap: wrap; } /* 通用卡片样式 */ .card { flex: 1; min-width: 350px; padding: 25px; border-radius: 10px; background-color: white; box-shadow: 0 2px 10px rgba(0,0,0,0.1); } /* 软件1.0 vs 2.0卡片 */ .card-software-1 { background-color: #f5f5f5; /* 浅灰色背景 */ } .card-software-2 { background-color: #fff4cc; /* 浅黄色背景 */ } .card h3 { font-size: 1.3rem; color: #2c3e50; margin-bottom: 15px; } /* 任务卡片 */ .card-verifiable { border-left: 4px solid #27ae60; /* 绿色左侧边框 */ } .card-non-verifiable { border-left: 4px solid #e74c3c; /* 红色左侧边框 */ } /* 任务标题 */ .task-title { font-size: 1.4rem; font-weight: bold; color: #2c3e50; margin-bottom: 25px; display: flex; align-items: center; gap: 10px; } /* 任务列表项 */ .task-item { font-size: 1.1rem; color: #555; margin-bottom: 15px; } /* 任务备注 */ .task-note { margin-top: 30px; font-size: 0.95rem; color: #777; line-height: 1.5; } /* 经济启示标题 */ .economic-title { font-size: 1.8rem; font-weight: bold; color: #2c3e50; margin-bottom: 40px; text-align: center; } /* 经济启示卡片 */ .card-economic { border-left: 4px solid #3498db; /* 蓝色左侧边框 */ } /* 引用区域 */ .quote-section { background-color: #fff4cc; /* 浅黄色背景 */ padding: 30px; border-radius: 10px; font-size: 1.2rem; text-align: center; font-style: italic; color: #2c3e50; margin-top: 60px; } /* 图标与文本对齐 */ .icon-text { display: flex; align-items: center; gap: 10px; } </style></head><body> <div class="ppt-container"> <!-- 标题区域 --> <div class="title-section"> <h1 class="main-title">AI 即 Software 2.0</h1> <p class="sub-title">判断自动化潜力的关键指标:可验证性</p> </div> <!-- Software 1.0 → 2.0 模块 --> <div class="content-section"> <h2 class="module-title"></> Software 1.0 → 2.0</h2> <div class="card-row"> <div class="card card-software-1"> <h3>Software 1.0</h3> <p>人类手动编写固定规则,只能自动化"易于指定"的任务,如打字、簿记。</p> </div> <div class="card card-software-2"> <h3>Software 2.0</h3> <p>指定目标函数,梯度下降自动搜索神经网络,自动化"易于验证"的任务。</p> </div> </div> </div> <!-- 可验证任务 vs 不可验证任务模块 --> <div class="content-section"> <div class="card-row"> <div class="card card-verifiable"> <div class="task-title"> <span class="icon-text">✅ 可验证任务</span> </div> <div class="task-item">📐 数学题</div> <div class="task-item">💻 代码编写</div> <div class="task-item">📊 观看时长分析</div> <div class="task-item">🧩 谜题/游戏</div> <div class="task-note">客观标准快速评估,强化学习可迅速超越人类顶尖水平。</div> </div> <div class="card card-non-verifiable"> <div class="task-title"> <span class="icon-text">❓ 不可验证任务</span> </div> <div class="task-item">🎨 艺术创作</div> <div class="task-item">🗣️ 复杂谈判</div> <div class="task-item">🏆 战略决策</div> <div class="task-item">🌍 常识推理</div> <div class="task-note">难以构建可靠奖励函数,依赖模仿或泛化,进展呈"锯齿状前沿"。</div> </div> </div> </div> <!-- 经济与就业启示模块 --> <div class="content-section"> <h2 class="economic-title">经济与就业启示</h2> <div class="card-row"> <div class="card card-economic"> <h3>锯齿状影响</h3> <p>可验证工作加速自动化;不可验证领域短期仍有缓冲。</p> </div> <div class="card card-economic"> <h3>岗位压缩</h3> <p>编程、数据分析等岗位面临快速自动化压力。</p> </div> <div class="card card-economic"> <h3>长期趋势</h3> <p>随着模拟器与验证工具完善,更多任务将落入AI掌控。</p> </div> </div> </div> <!-- 引用区域 --> <div class="quote-section"> <p>"Software 1.0 自动化你能指定的;</p> <p>Software 2.0 自动化你能验证的。"</p> </div> </div></body></html>
只输出代码肯定是远远不够,关键是要看输出的代码和源截图的样式是否一致,然后添加了一些内容补充到这个html代码中,最终出现了文章最开头产品简介的截图,就是用识别出来的html代码生成的,效果还是非常不错的。手绘草图生成的代码平时工作coding中除了截图有生成代码的需求,对于产品和开发来说都有手绘草图的习惯,那么通过这种方式是不是也能通过doubao-seed-code帮我们生成呢?
这就很惊艳了,随便一个草图,居然给出了一个表单提交代码,识别的还很精准,日期直接给出了时间控件,特长给出了下拉框可以选择,这还要前端UI设计干啥呢?哈哈,如果用UI设计稿生成出来的代码效果可想而知,对于前端开发来说基本就是秒出。
如果Trae和seed-code组合能登顶SOTA,seed-code和claude code组合能释放出什么样的大招呢?要知道claude code在使用token上就像泄洪的水一样一发不可收拾,开发一个小项目token唰唰的往下掉,看得都心疼。
现在seed-code推出了首月9.9的优惠。在调用价格上,DouBao-Seed-Code不仅在输入输出单价上给到最低,同时采用全量透明Cache,成本再降低80%。在实际使用场景中,综合使用成本降低62.7%,基本上可以达到国内最低价格,狠狠地普惠开发者一波。所以很有必要介绍一下价格Doubao-Seed-Code核心价格体系竞品对比表
价格体系
1. Doubao-Seed-Code 分层定价规则(含全量Cache优化)
| 输入Token区间 | 输入基础价(元/百万Tokens) | 输入Cache后价(元/百万Tokens) | 输出基础价(元/百万Tokens) | 输出Cache后价(元/百万Tokens) |
|---|---|---|---|---|
| 0-32k | 1.20 | 0.24(降本80%) | 8.00 | 1.60(降本80%) |
| 32-128k | 1.40 | 0.28(降本80%) | 12.00 | 2.40(降本80%) |
| 128-256k | 2.80 | 0.56(降本80%) | 16.00 | 3.20(降本80%) |
注:全量透明Cache可直接减免80%重复Token成本,国内唯一覆盖全Token区间的Cache优化策略
2. 实际场景同Token量成本对比(0-32k区间,创建交互式英语学习网站)
| 测试场景/模型 | 相同Tokens量下的使用成本 | 成本优势说明 |
|---|---|---|
| 交互式英语学习网站·Doubao-Seed-Code | ~0.34元 | 国内最低,综合降本62.7% |
| 交互式英语学习网站·Claude Sonnet 4.5 | ~4.05元 | 对比Doubao-Seed-Code高约10.9倍 |
| 交互式英语学习网站·GLM-4.6 | ~0.77元 | 对比Doubao-Seed-Code高约1.26倍 |
seed-code接入claude code这一波Coding Plan 支持 Claude Code、Cursor、Cline、Codex CLI、veCLI等编程工具,无论你喜欢上手哪一款工具都可以适用,下面咱们以接入claude code为例看看这款编程大模型的输出效果安装步骤这里就不在重复说明,详情参考往期文章白嫖100刀,免费使用Claude Code所不同的是秘钥和大模型地址需要配置一下
echo -e '\n export ANTHROPIC_AUTH_TOKEN=sk-...' >> ~/.bash_profileecho -e '\n export ANTHROPIC_BASE_URL=https://ark.cn-beijing.volces.com/api/coding' >> ~/.bash_profile
出现这个日志说明doubao-seed-code模型是可用状态
IDE Integration • /config ✔ Connected to VS Code extension L Installed VS Code extension version 2.0.44 (server version: 1.0.78) Account L Auth Token: ANTHROPIC_AUTH_TOKEN API Configuration L Anthropic Base URL: https://ark.cn-beijing.volces.com/api/coding Model • /model L doubao-seed-code-preview-latest
批量下载测试
批量下载400+图片到本地为何选择400张图片也是想验证一下代码的稳定性,因为考虑到图片比较多而且都是从网络上获取并下载到本地肯定有一定的延迟性。
doubao01.png果不其然第一次生成的代码因为超时终止了运行,好在它自己发现了错误修正了脚本并继续进行重试。
doubao02.png继续下载,但是还是有34张图片由于服务器错误或超时导致未能下载,也及时进行了纠错把未下载的图片创建了一个新的列表,然后进行二次处理。并在检测后发现有些图片的链接地址是重复的。
反正整个过程我就是一直扣1,基本没有做任何干预。最终把所有的图片都下载到了本地。所有下载的图片都已上传到开源提示词图片网站上,感兴趣的小伙伴可以自行下载体验。
https://zhenglarry007.github.io/opennana-gallery/opennana-framework.html
如果本文对您有帮助,也请帮忙点个 赞👍 + 在看 哈!❤️关注
