618 AI套餐暗战指南, 我帮你把字节阿里等5家平台的账算清了 - 文章 - 开发者社区

用Hermes Agent, OpenClaw或者Claude Code等写代码的Agent朋友，最近应该都感觉到了——AI编程套餐这半年洗牌洗得飞快。腾讯云把Coding Plan全线下架换成了Token Plan，MiniMax从按次改成按Token池惹来一堆投诉，字节又搞了个"业界首个Agent套餐包"。

作为每天开Hermes干活的人，这几个平台我都摸过一遍，今天不讲虚的，直接算账。

先说结论：目前适配Agent用户比较到位的，是字节方舟的Agent Plan。 不是我偏心，往下看数据。

一、按次计费套餐：每100次实际花多少钱？

先把各家按请求次数算钱的套餐摊开看。统一折算成"每100次有效请求"的成本，同时标注了每家的可用模型——模型多寡直接影响你实际能干什么活。

平台套餐	月费	月可用量	每100次成本	可用模型	特别限制
字节 Agent Small	¥40	20,000 AFP	¥0.20	Doubao-Seed全系 + GLM-5.1 + Kimi-K2.6，含Seeddance/Seedream多模态	公测每日限量
字节 Agent Medium	¥200	100,000 AFP	¥0.20	同上	公测每日限量
字节 Coding Lite	¥40	18,000次	¥0.22	Doubao-Seed-2.0-Code + DeepSeek-V4 + GLM-5.1 + Kimi-K2.6 + MiniMax-M2.7，Auto智能调度	额度仅限编程工具
字节 Coding Pro	¥200	90,000次	¥0.22	同上	额度仅限编程工具
阿里 Coding Lite	¥40	18,000次	¥0.22	Qwen3.5-Plus、Qwen3-Max、Qwen3-Coder-Plus、Kimi-K2.5、GLM-5、MiniMax-M2.5	⚠️ 已停售
阿里 Coding Pro	¥200	90,000次	¥0.22	同上，共7款模型	⚠️ 每日限量抢购
智谱 GLM Lite	¥49	~6,000次等效	¥0.82	仅GLM-4.7/4.6	纯自研，无三方模型
智谱 GLM Pro	¥149	~30,000次等效	¥0.50	GLM-5 + GLM-4.7/4.6，GLM-5为355B MoE旗舰	高峰期×3倍消耗
智谱 GLM Max	¥469	~120,000次等效	¥0.39	GLM-5 + GLM-4.7/4.6全系	高峰期×3倍消耗

注：AFP 是火山引擎 Agent Plan 专门创造的计量单位，全称是Agent Fuel Points（Agent 燃料值），本质上就是一种 Credits（积分）

从模型维度看，差异比较明显：

字节的模型阵容相对豪华：Agent Plan覆盖自研Seed全系（含图像/视频多模态）加上GLM-5.1和Kimi-K2.6，Auto模式自动调度最优模型，省去手动切换的麻烦。Coding Plan更额外包含DeepSeek-V4和MiniMax-M2.7 。
阿里云模型数量最多（7款），涵盖千问、Kimi、GLM、MiniMax四条路线，选择面最宽，但Pro经常售罄，有模型也买不到套餐。
智谱走纯自研路线，仅GLM系列，好处是高度优化、不依赖三方，但想换口味没得选。
MiniMax和腾讯云在下表Token池详述。

二、Token池套餐：每百万Token花多少钱？

另一类是MiniMax和腾讯云的Token池模式——固定的Token池子用完即停，不限请求次数。适合长上下文场景。

平台套餐	月费	月Token额度	每百万Token成本	可用模型	使用限制
MiniMax Plus	¥49	~6亿	¥0.082	M3(旗舰) + M2.7/M2.5 + 图像/语音(Speech 2.8)/音乐/视频(Hailuo 2.3)全系，原生多模态	工作日15:00-17:30动态限流
MiniMax Max	¥119	~18亿	¥0.066	同上，全部模型可用	工作日15:00-17:30动态限流
MiniMax Ultra	¥469	~55亿	¥0.085	同上，全模态全模型	工作日15:00-17:30动态限流
腾讯云 Hy Lite	¥28	3,500万	¥0.80	仅混元Hy3 preview一款	模型单一
腾讯云 Hy Pro	¥238	3.2亿	¥0.74	仅混元Hy3 preview一款	模型单一
腾讯云通用 Lite	¥39	3,500万	¥1.11	混元Hy3 + GLM-5 + MiniMax-M2.5 + Kimi-K2.5等多款	Token额度偏少
腾讯云通用 Pro	¥299	3.2亿	¥0.93	同上，支持多模型自由切换	Token额度偏少

模型维度的几个关键发现：

MiniMax的M3是原生多模态旗舰，同一个Token池可同时调用文本、图像、语音、音乐、视频五大类模型，这意味着你用Hermes做工具调用时，图片理解和视频分析不需要额外切换平台。
M3支持1M上下文，长文档处理不会被截断，这是Token池模式中比较大的一个差异化优势。
腾讯云Hy系列仅混元Hy3 preview一款模型——价格确实低（¥28起），但模型单一意味着所有任务只能靠这一款模型，编程、推理、分析都用同一套。
腾讯云通用版虽然支持多模型切换，但同样价位的Token额度比MiniMax少很多（通用Pro ¥299仅3.2亿token vs MiniMax Max ¥119含18亿token），性价比差距明显。

三、模型多样性的实际意义

对于Agent用户来说，模型多样性不只是"选择多"的问题，而是直接影响工作流效率：

编程主力和推理辅助可以分开：用Doubao-Seed或Qwen3-Coder做编码，用GLM-5或Kimi-K2.6做逻辑推理和架构分析，不同任务调用不同的最优模型。
多模态需求不用切平台：MiniMax全模态覆盖意味着图片理解、语音转文字、视频分析都在一个套餐内完成。字节Agent Plan的Seedance/Seedream也覆盖了图音视频。
Auto智能调度减少决策负担：字节的Auto模式根据任务类型自动匹配最优模型，你不用每次手动指定用哪个模型，对Agent自动化工作流比较友好。
纯自研路线的利弊：智谱GLM-5（355B MoE）编程能力对标Claude Sonnet 4.5，生成速度55+ tokens/秒，纯自研意味着深度优化和稳定性，但如果你想偶尔换换口味，没得选。

四、按场景选购建议

场景A：日常开发，偶尔用Hermes写脚本、查文档

推荐：字节 Agent Small（¥40/月，¥0.20/100 AFP）
备选：字节 Coding Lite（¥40/月，首月¥9.9体验）

理由：同价位下Agent Plan模型更丰富（Seed全系+GLM-5.1+Kimi-K2.6），自带联网搜索和Auto智能调度。备选Coding Lite多了DeepSeek-V4和MiniMax-M2.7，但少了多模态模型。

场景B：高强度Agent工作流，同时跑2-3个任务

推荐：字节 Agent Medium（¥200/月，¥0.20/100 AFP）
备选：MiniMax Token Max（¥119/月，¥0.066/百万token）

理由：Agent Medium有100,000 AFP月额度，5小时限额10,000 AFP对多Agent并发足够，模型涵盖Seed全系+三方模型。MiniMax月费更低、单位成本也低，M3全模态+1M上下文在长对话和图片理解场景有额外优势。

场景C：超大代码库、多轮长对话

推荐：MiniMax Token Max（¥119/月）

理由：1M上下文 + ¥0.066/百万token的性价比，长文档处理不会被截断。全模态模型覆盖图像/语音/视频，同一个token池无需切换。注意工作日15:00-17:30有动态限流。

场景D：团队多人使用Hermes

推荐：阿里云Token Plan团队版标准坐席（¥198/人/月）

理由：Credits统一管理，RAM子账号独立配额，数据安全承诺不用于训练。支持千问、GLM、MiniMax、DeepSeek等多款模型的团队调度。服务地域目前仅限华北2（北京）。

场景E：预算极有限，先试试水

推荐：腾讯云Hy Token Lite（¥28/月）
备选：字节Coding Lite首月（¥9.9，体验一个月）

理由：腾讯云入门价确实低，但仅混元Hy3 preview一款模型——试水够用，长期用模型单一会有局限。

五、避坑清单

阿里云Coding Pro每日限量补货——加班时买不到真的很尴尬。生产环境不建议依赖它。
MiniMax近期计费争议——致歉声明已发。建议先按月订观察，别冲动年付。
智谱GLM-5高峰期按3倍消耗——下午2点到6点之间，你的实际用量可能只有预期的1/3。
腾讯云历史涨价幅度偏高——HY2.0系列曾涨400%+，2026年5月又上调5%。
Coding Plan额度禁止API直调——通过非官方Base URL使用可能封号。
字节Agent Plan公测每日限购——目前每日四档总计限购5500份。

六、第三个选择：本地部署，零月费

如果你对订阅制感到疲惫，或者对网络隐私有要求，还有一个方案——通过仙踪·爱马仕助手（Hermes Assistant）在Mac上部署本地模型。

它内置了oMLX引擎，适配Apple芯片（M系列），可以在你的Mac上直接跑大模型。8个预置模型中，Qwen3.6-35B（256K上下文）做编码、Gemma4 26B做逻辑推理，Gemma4 12B做日常图文处理, 日常办公和轻量开发的token需求基本能覆盖。

优势是零网络延迟、数据不出本地、没有月费账单。缺点是需要占用本地算力和存储空间。

对于不想被各种套餐规则折腾的朋友，这是一个值得了解的Plan C。

一句话总结：Hermes/OpenClaw用户优先看字节Agent Plan（¥40/月起，¥0.20/100 AFP，模型丰富+Auto调度），长上下文重度场景考虑MiniMax Token Max（¥119/月，¥0.066/百万token，全模态覆盖），想彻底摆脱月费的探索本地模型部署。

数据来源：各平台官方定价页面及公开信息，截至2026年6月。价格可能随时变动。

picture.image