用 DeepSeek V4 写一篇 1000 字的商业方案,API 成本是多少?
不到 3 厘钱。
不是比喻。是精确到小数点后四位的计算结果。
但如果你不懂「缓存命中」这个概念,同样的任务,你的账单可能是别人的 50 倍。
🤯 多数人第一次看大模型价格表,反应都一样
「输入 1 元/百万 Token?输出 2 元/百万 Token?这到底多少钱?」
然后凭借直觉瞎猜:「百万 Token 听起来很多,应该挺便宜的吧。」
或者走向另一个极端:「百万 Token 才几块钱,随便用。」
两个都是错的。 真相比直觉要反常识得多——你用对方法,它是白菜价;用错方法,你的账单在默默流血。
下面用 DeepSeek V4 这张官方价格表,一次把计费逻辑讲透。
📐 先锚定一个概念:Token 不等于「字」
很多人误以为计费单位是字数。不是。计费单位是 Token。
换算关系很简单:
- 中文:1 个字 ≈ 1.3 个 Token
- 英文:1 个单词 ≈ 1.3 个 Token
反过来,100 万 Token(计费单位「百万 Token」)大约等于 77 万个汉字。相当于一本《三体》第一部全文的量。
有了这杆秤,再回来看价格,你脑子里就有画面了。
而价格表里那个「输入/输出」,拆开看就两句大白话:
- 输入你发给模型的所有内容——提问、历史对话、系统提示词——都算
- 输出模型返回给你的回答——全部算
🧾 手把手拆一张真实价格表
以 deepseek-v4-flash 为例,表上有三行数字:
| 费用类型 | 单价(元/百万Token) | 你理解成什么 |
|---|---|---|
| 输入(缓存命中) | 0.02 元 | 系统认识这段内容,直接复用,约等于不要钱 |
| 输入(缓存未命中) | 1 元 | 系统不认识,要重新处理,是缓存价的 50 倍 |
| 输出 | 2 元 | 模型生成回答,固定价,没有缓存优惠 |
这里藏着一个 98% 的人都不知道的秘密:第二行和第一行的价差。
什么是「缓存命中」?
如果你的系统提示词、对话上下文跟之前一样,DeepSeek 不会重复处理——直接用缓存结果,成本降为原来的 1/50。
对于长对话、多轮调用、固定系统提示词的场景,这是真金白银的节省。
而 deepseek-v4-pro 更夸张——缓存未命中的输入是 12 元/百万 Token,输出 24 元/百万 Token。分别是 Flash 的 12 倍。
👉 模型越强,缓存的重要性越大。
🧮 用实际场景算一笔账,立刻清醒
场景一:写一篇 1000 字方案
你发给模型的提示词大约 200 Token(≈150 字)。模型返回 1000 字方案,大约 1300 Token。
假设是第一次提问,缓存未命中。用 deepseek-v4-flash:
- 输入费用:200 ÷ 1,000,000 × 1 元 = 0.0002 元
- 输出费用:1300 ÷ 1,000,000 × 2 元 = 0.0026 元
👉 总成本:0.0028 元。不到 3 厘钱。
场景二:带固定系统提示词的长对话
假设你有一套 10,000 Token 的系统提示词(约 7700 字),跟模型来回聊了 10 轮:
- 第 1 轮,输入 10,000 Token,缓存未命中:
10,000 / 1,000,000 × 1 = 0.01 元 - 第 2-10 轮,同一段提示词命中缓存:
10,000 / 1,000,000 × 0.02 = 0.0002 元/次 - 假设每轮输出 500 Token,总输出 10 × 500 × 2 / 1,000,000 = 0.01 元
👉 10 轮总成本:0.01 + 9 × 0.0002 + 0.01 = 0.0218 元。两分钱。
如果没有缓存,仅输入就要 0.1 元。
缓存帮你省了 98% 的输入成本。
🔑 四个你应该刻在脑子的结论
1. 输出才是大头
输入有缓存兜底,输出没有。写长文、生成代码的花费主要在输出端。
2. 缓存是大模型计费里最大的「隐藏折扣」
不是优惠券,不用领。系统提示词和上下文重复了,自动触发。很多开发者用了半年不知道有这个东西。
3. Flash vs Pro 的价格差就是「性价比 vs 性能」的取舍
Flash 输入(未命中)1 元,Pro 原价 12 元。差距 12 倍。你不是总需要 Pro,大多数日常任务 Flash 绰绰有余。
4. 一个通用公式,建议保存
总费用 = (输入Token ÷ 1,000,000 × 输入单价) + (输出Token ÷ 1,000,000 × 输出单价)
其中输入单价取决于是否命中缓存。
💡 一句话总结:大模型 API 没有你想象的贵,也没有你想象的便宜。贵和便宜之间差的,是你对这张价格表的理解程度。
3 厘钱一篇方案是事实。两分钱聊十轮也是事实。
前提是——你知道「缓存命中」那行是什么。
