最近的开发环境基本稳定在 Claude Code + X,Claude Code 的 Agent 架构和命令行形式是我喜欢的,虽也有测试 CodeX 等不过暂时还没有足够的动力切换。而这里的 X 主要是因为 Anthropic 这个奇怪的公司封号太狠,之前的 Claude API 被封了也不想折腾,索性现在新推出的 LLM API 基本都会兼容 OpenAI 和 Anthropic API,也就可以快速接入 Claude Code。
之前 X 用过 GLM 4.6、Kimi K2、MiniMax M2 等,有些是测试体验,有些也断续的用几天,这些模型在 Code和 Agentic 方向的评测分数都很接近 Claude Sonnet 4.5 了,虽然还是有一些差距。不过一直有一个问题,这些 LLM 都是纯文本能力,没有视觉理解能力。虽然可以通过 Claude Code 中调用 OCR 类工具或 MCP 来实现,不过总感觉没有自身能力来的更好。因为 OCR 类工具,更偏重识别图片中的文字和布局等信息,对于「设计感」会丢失,这就很大程度上限制了「设计 → 开发」中的设计还原。
前几天看到字节发布了 Doubao-Seed-Code,面向编程和智能体场景的 LLM,看官方评测基本属于最强开源模型行列,价格也比 Claude 低很多,支持 文字、图片、视频 输入,对我这种想贴设计图、参考视频的习惯,是很符合的。而且看到火山引擎推出「Coding Plan」,还挺划算,而且… 刚好看到我的火山引擎账号下有优惠券,先整一个月的 Lite 套餐(9块9)试试看。
开始前,先贴一段 Doubao-Seed-Code 的官方介绍,大家可以先看看:
Doubao-Seed | 豆包code模型
面向Agentic编程任务深度优化
支持 256K 长上下文,让模型轻松处理长代码文件、多模块依赖等复杂场景,更好支持端到端自主编程,在全栈开发中表现良好,前端能力尤为突出。
国内 首个支持视觉理解能力 的编程模型,可参照UI设计稿、截图或手绘草图生成代码,或对生成页面进行视觉比对,自主完成样式修复和Bug修复,大幅提升前端开发效率。
沿用了火山引擎首创的分层定价模式,并配合全量透明Cache能力,在多轮对话中进一步降低成本。
多生态兼容
兼容 Anthropic API,对于使用Claude Code的团队,只需几行代码即可切换到Doubao-Seed-Code,享受更高性价比的服务。
针对Claude Code、TRAE等主流开发工具进行特别优化,提供稳定可靠的调用体验。
方舟Coding Plan接入方式
方舟 Coding Plan 是为广大开发者量身打造的AI Coding场景订阅服务,支持最新的 Doubao-Seed-Code模型与多款主流 AI 编码工具,为开发者提供畅快、顶尖、无忧的编码体验,大幅提升代码编写效率与质量。
https://www.volcengine.com/activity/codingplan
我一般会用给我儿子做的知识问答网页来做模型能力体验,我的需求是:
为六岁的孩子设计一个知识问答页面,知识范围包括数学、动植物、天文、地球和宇宙等不同方面。每次生成10个问题和答案,支持刷新问题。
设计风格请参考 Khan Kids。
问答生成方面,请调用 LLM API 来实现,调用示例代码和 API Key 在这,其中 API Key 你可以 hardcode 到代码中,我只是自己使用,不考虑安全问题。接入示例代码:{把包含 API Key 的接入代码贴在这里}
为了体验模型的视觉理解能力,我把想参考的 Khan Kids 网址和网页截图也加到需求提示词里。然后,就开干吧!
先是在火山引擎申请 API Key,然后下面两步操作,把它接入 Claude Code:
vim ~/.claude/settings.json
{ "env": { "ANTHROPIC_AUTH_TOKEN": "ARK_API_KEY", "ANTHROPIC_BASE_URL": "<https://ark.cn-beijing.volces.com/api/coding>", "API_TIMEOUT_MS": "3000000", "ANTHROPIC_MODEL": "doubao-seed-code-preview-latest" } }
现在真的开干了,咱们采用 Spec 模式,让 Claude Code + Doubao-Seed-Code 先把需求理解和确认完成,输出它的计划和任务拆分,我看完确认,就开始设计编码了。
然后,我就去看视频摸鱼了,几分钟后回来看了一眼,已经完成了,打开网页看了看,效果不错,
操作了一遍功能,也是完整的,我提供的 LLM API 调用也集成进去了。我让它参考的 Khan Kids 网页的设计风格,也有很认真的理解和参考,还为我加入了一些动画元素点缀。
另外有些小惊喜的是,除了正常的文字、Todo 等展示,还把网页布局在 CLI 里给我做了一个示意,更方便在不离开 CLI 的情况下能够快速预览和确认,我是不是要这个布局。
好啦,我儿子的 AI 问答又更新了。这回要好好利用这一个月的 Coding Plan 多测一些其他场景,再来给朋友们更新 Doubao-Seed-Code 的编程体验。
