以Deepseek API的官方价格表为例,解读大模型的输入输出报价

用 DeepSeek V4 写一篇 1000 字的商业方案,API 成本是多少?

不到 3 厘钱。

不是比喻。是精确到小数点后四位的计算结果。

但如果你不懂「缓存命中」这个概念,同样的任务,你的账单可能是别人的 50 倍。

picture.image

🤯 多数人第一次看大模型价格表,反应都一样

「输入 1 元/百万 Token?输出 2 元/百万 Token?这到底多少钱?」

然后凭借直觉瞎猜:「百万 Token 听起来很多,应该挺便宜的吧。」

或者走向另一个极端:「百万 Token 才几块钱,随便用。」

两个都是错的。  真相比直觉要反常识得多——你用对方法,它是白菜价;用错方法,你的账单在默默流血。

下面用 DeepSeek V4 这张官方价格表,一次把计费逻辑讲透。

📐 先锚定一个概念:Token 不等于「字」

很多人误以为计费单位是字数。不是。计费单位是 Token。

换算关系很简单:

  • 中文:1 个字 ≈ 1.3 个 Token
  • 英文:1 个单词 ≈ 1.3 个 Token

反过来,100 万 Token(计费单位「百万 Token」)大约等于 77 万个汉字。相当于一本《三体》第一部全文的量。

有了这杆秤,再回来看价格,你脑子里就有画面了。

而价格表里那个「输入/输出」,拆开看就两句大白话:

  • 输入你发给模型的所有内容——提问、历史对话、系统提示词——都算
  • 输出模型返回给你的回答——全部算

picture.image

🧾 手把手拆一张真实价格表

以 deepseek-v4-flash 为例,表上有三行数字:

费用类型单价(元/百万Token)你理解成什么
输入(缓存命中)0.02 元系统认识这段内容,直接复用,约等于不要钱
输入(缓存未命中)1 元系统不认识,要重新处理,是缓存价的 50 倍
输出2 元模型生成回答,固定价,没有缓存优惠

这里藏着一个 98% 的人都不知道的秘密:第二行和第一行的价差。

什么是「缓存命中」?

如果你的系统提示词、对话上下文跟之前一样,DeepSeek 不会重复处理——直接用缓存结果,成本降为原来的 1/50

对于长对话、多轮调用、固定系统提示词的场景,这是真金白银的节省。

而 deepseek-v4-pro 更夸张——缓存未命中的输入是 12 元/百万 Token,输出 24 元/百万 Token。分别是 Flash 的 12 倍。

👉 模型越强,缓存的重要性越大。

🧮 用实际场景算一笔账,立刻清醒

场景一:写一篇 1000 字方案

你发给模型的提示词大约 200 Token(≈150 字)。模型返回 1000 字方案,大约 1300 Token。

假设是第一次提问,缓存未命中。用 deepseek-v4-flash

  • 输入费用:200 ÷ 1,000,000 × 1 元 = 0.0002 元
  • 输出费用:1300 ÷ 1,000,000 × 2 元 = 0.0026 元

👉 总成本:0.0028 元。不到 3 厘钱。


场景二:带固定系统提示词的长对话

假设你有一套 10,000 Token 的系统提示词(约 7700 字),跟模型来回聊了 10 轮:

  • 第 1 轮,输入 10,000 Token,缓存未命中:10,000 / 1,000,000 × 1 = 0.01 元
  • 第 2-10 轮,同一段提示词命中缓存:10,000 / 1,000,000 × 0.02 = 0.0002 元/次
  • 假设每轮输出 500 Token,总输出 10 × 500 × 2 / 1,000,000 = 0.01 元

👉 10 轮总成本:0.01 + 9 × 0.0002 + 0.01 = 0.0218 元。两分钱。

如果没有缓存,仅输入就要 0.1 元。

缓存帮你省了 98% 的输入成本。

picture.image

🔑 四个你应该刻在脑子的结论

1. 输出才是大头

输入有缓存兜底,输出没有。写长文、生成代码的花费主要在输出端。

2. 缓存是大模型计费里最大的「隐藏折扣」

不是优惠券,不用领。系统提示词和上下文重复了,自动触发。很多开发者用了半年不知道有这个东西。

3. Flash vs Pro 的价格差就是「性价比 vs 性能」的取舍

Flash 输入(未命中)1 元,Pro 原价 12 元。差距 12 倍。你不是总需要 Pro,大多数日常任务 Flash 绰绰有余。

4. 一个通用公式,建议保存

总费用 = (输入Token ÷ 1,000,000 × 输入单价) + (输出Token ÷ 1,000,000 × 输出单价)

其中输入单价取决于是否命中缓存。


💡 一句话总结:大模型 API 没有你想象的贵,也没有你想象的便宜。贵和便宜之间差的,是你对这张价格表的理解程度。

3 厘钱一篇方案是事实。两分钱聊十轮也是事实。

前提是——你知道「缓存命中」那行是什么。

0
0
0
0
评论
未登录
暂无评论