以Deepseek API的官方价格表为例，解读大模型的输入输出报价 - 文章 - 开发者社区

用 DeepSeek V4 写一篇 1000 字的商业方案，API 成本是多少？

不到 3 厘钱。

不是比喻。是精确到小数点后四位的计算结果。

但如果你不懂「缓存命中」这个概念，同样的任务，你的账单可能是别人的 50 倍。

picture.image

🤯 多数人第一次看大模型价格表，反应都一样

「输入 1 元/百万 Token？输出 2 元/百万 Token？这到底多少钱？」

然后凭借直觉瞎猜：「百万 Token 听起来很多，应该挺便宜的吧。」

或者走向另一个极端：「百万 Token 才几块钱，随便用。」

两个都是错的。 真相比直觉要反常识得多——你用对方法，它是白菜价；用错方法，你的账单在默默流血。

下面用 DeepSeek V4 这张官方价格表，一次把计费逻辑讲透。

📐 先锚定一个概念：Token 不等于「字」

很多人误以为计费单位是字数。不是。计费单位是 Token。

换算关系很简单：

中文：1 个字 ≈ 1.3 个 Token
英文：1 个单词 ≈ 1.3 个 Token

反过来，100 万 Token（计费单位「百万 Token」）大约等于 77 万个汉字。相当于一本《三体》第一部全文的量。

有了这杆秤，再回来看价格，你脑子里就有画面了。

而价格表里那个「输入/输出」，拆开看就两句大白话：

输入你发给模型的所有内容——提问、历史对话、系统提示词——都算
输出模型返回给你的回答——全部算

picture.image

🧾 手把手拆一张真实价格表

以 deepseek-v4-flash 为例，表上有三行数字：

费用类型	单价（元/百万Token）	你理解成什么
输入（缓存命中）	0.02 元	系统认识这段内容，直接复用，约等于不要钱
输入（缓存未命中）	1 元	系统不认识，要重新处理，是缓存价的 50 倍
输出	2 元	模型生成回答，固定价，没有缓存优惠

这里藏着一个 98% 的人都不知道的秘密：第二行和第一行的价差。

什么是「缓存命中」？

如果你的系统提示词、对话上下文跟之前一样，DeepSeek 不会重复处理——直接用缓存结果，成本降为原来的 1/50。

对于长对话、多轮调用、固定系统提示词的场景，这是真金白银的节省。

而 deepseek-v4-pro 更夸张——缓存未命中的输入是 12 元/百万 Token，输出 24 元/百万 Token。分别是 Flash 的 12 倍。

👉 模型越强，缓存的重要性越大。

🧮 用实际场景算一笔账，立刻清醒

场景一：写一篇 1000 字方案

你发给模型的提示词大约 200 Token（≈150 字）。模型返回 1000 字方案，大约 1300 Token。

假设是第一次提问，缓存未命中。用 deepseek-v4-flash：

输入费用：200 ÷ 1,000,000 × 1 元 = 0.0002 元
输出费用：1300 ÷ 1,000,000 × 2 元 = 0.0026 元

👉 总成本：0.0028 元。不到 3 厘钱。

场景二：带固定系统提示词的长对话

假设你有一套 10,000 Token 的系统提示词（约 7700 字），跟模型来回聊了 10 轮：

第 1 轮，输入 10,000 Token，缓存未命中：10,000 / 1,000,000 × 1 = 0.01 元
第 2-10 轮，同一段提示词命中缓存：10,000 / 1,000,000 × 0.02 = 0.0002 元/次
假设每轮输出 500 Token，总输出 10 × 500 × 2 / 1,000,000 = 0.01 元

👉 10 轮总成本：0.01 + 9 × 0.0002 + 0.01 = 0.0218 元。两分钱。

如果没有缓存，仅输入就要 0.1 元。

缓存帮你省了 98% 的输入成本。

picture.image

🔑 四个你应该刻在脑子的结论

1. 输出才是大头

输入有缓存兜底，输出没有。写长文、生成代码的花费主要在输出端。

2. 缓存是大模型计费里最大的「隐藏折扣」

不是优惠券，不用领。系统提示词和上下文重复了，自动触发。很多开发者用了半年不知道有这个东西。

3. Flash vs Pro 的价格差就是「性价比 vs 性能」的取舍

Flash 输入（未命中）1 元，Pro 原价 12 元。差距 12 倍。你不是总需要 Pro，大多数日常任务 Flash 绰绰有余。

4. 一个通用公式，建议保存

总费用 = (输入Token ÷ 1,000,000 × 输入单价) + (输出Token ÷ 1,000,000 × 输出单价)

其中输入单价取决于是否命中缓存。

💡 一句话总结：大模型 API 没有你想象的贵，也没有你想象的便宜。贵和便宜之间差的，是你对这张价格表的理解程度。

3 厘钱一篇方案是事实。两分钱聊十轮也是事实。

前提是——你知道「缓存命中」那行是什么。