盘点国内外大模型推理服务 API 价格

技术

点击下方 卡片 ,关注“ 慢慢学AIGC ”

picture.image

图片由 DALL·E 3 生成,prompt:A senior financial analyst deep in thought, surrounded by various charts including bar graphs, pie charts, and line graphs floating around her. A robot is next to her, explaining or interpreting the data. The scene is set in a modern office with a large window showing a cityscape. The analyst has a thoughtful expression, holding a pen and a notepad. The robot looks advanced, with a screen displaying more data. The overall atmosphere is professional and high-tech.

本文将为你盘点截至 2024.5.17 国内各个大模型推理服务的 API 价格以及支持的特性(上下文窗口长度、是否支持多模态输入等)。注意价格可能会随时由厂商调整,请以官方最新数字为准。汇总表格在文末。本文尚未收纳的条目会在后台进行更新,需要原始文档可以私信获取。

注意:为了方便横向对比,我们的价格都以百万(1M)tokens 费用为准,其中输入 tokens 和输出 tokens 比例均为 50%,国内外费用统一换算为人民币(CNY)。

OpenAI GPT

OpenAI 是目前行业的标杆,具有目前最强大的模型 GPT-4o 以及最广泛的用户,价格贵有贵的道理。有关 GPT-4o 详细信息可以查看《重磅:OpenAI 发布 GPT-4o,支持实时音视频交互

信息来源:https://platform.openai.com/docs/models

价格表:

picture.image

Anthropic Claude

Anthropic 与 OpenAI 的渊源颇深。由于在 OpenAI 在发展方向上产生分歧,担心微软对 OpenAI 的首次 10 亿美元的投资后,会使其走上更加商业化的道路,偏离初衷,彼时为 OpenAI 研发副总裁 Dario Amodei 领导的团队选择离开并在 2021 年成立了 Anthropic。2023 年 3 月份 Anthropic 发布了一款类似 ChatGPT 的AI聊天机器人产品 Claude。Claude 有 520 亿个参数,最初通过 Slack 集成在封闭测试版中提供。2023 年 7月,Anthropic 推出了新版人工智能聊天机器人:Claude 2,上下文扩展至 100K,直接与 GPT-4 竞争。2024 年 3 月推出 Claude 3,步步紧跟 OpenAI 。

信息来源:https://www.anthropic.com/api

价格表:

picture.image

picture.image

picture.image

Google Gemini

Google I/O 2024 上更新了 Gemini 1.5 Pro 系列模型,会议摘录见《Google I/O 2024 亮点摘录

信息来源:https://ai.google.dev/pricing

价格表:

picture.image

picture.image

picture.image

Mistral

Mistral AI 是由前 Google DeepMind 和前 Meta 员工组建的位于法国的初创公司。Mistral 开源模型有 Mistral 7B、Mixtral 8x7B 和 Mixtral 8x22B,性能表现如下图所示。

picture.image

picture.image

在官方 API 中我们看到除了开源的模型外还有闭源模型。

picture.image

信息来源:

https://mistral.ai/technology/

https://console.mistral.ai/billing/subscribe/

价格表:

picture.image

Groq

Groq 是前 Google TPU 团队成员组建的初创公司,主要提供面向 LLM 的定制芯片(称为语言处理单元 LPU)以及配套系统,LLaMA 3 70B 推理速度超过 300 tokens/s。

信息来源:https://wow.groq.com/

价格表:

picture.image

百度千帆

信息来源:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7

价格表:

picture.image

腾讯混元

信息来源:https://cloud.tencent.com/document/product/1729/97731

价格表:

picture.image

阿里通义千问

信息来源:https://help.aliyun.com/document\_detail/2712573.html

价格表:

picture.image

讯飞星火

信息来源:https://xinghuo.xfyun.cn/sparkapi

价格表:

picture.image

字节豆包

信息来源:https://www.volcengine.com/docs/82379/1099320

价格表:

picture.image

月之暗面 Kimi

信息来源:https://platform.moonshot.cn/docs/pricing

价格表:

picture.image

智谱

信息来源:https://open.bigmodel.cn/pricing

价格表:

picture.image

picture.image

MiniMax

信息来源:https://www.minimaxi.com/document/price

价格表:

picture.image

零一万物

信息来源:https://platform.lingyiwanwu.com/docs#%E4%BA%A7%E5%93%81%E5%AE%9A%E4%BB%B7

价格表:

picture.image

百川

信息来源:https://platform.baichuan-ai.com/price

价格表:

picture.image

DeepSeek

信息来源:https://platform.deepseek.com/api-docs/zh-cn/pricing/

价格表:

picture.image

汇总表格

下表汇总了目前已知大模型推理服务 API 价格信息:

| 厂商 | 模型版本 | 时效性(截止时间) | 上下文长度(tokens) | 每 100 万 tokens 定价 | 多模态支持情况 | | OpenAI | GPT-4o | 2023 年 10 月 | 128K | 输入 5,输出15, 输出 15 | TIAV->TA | | GPT-4 Turbo | 2023 年 12 月 | 128K | 输入 10,输出30,输出 30 | TI->T | | GPT-3.5 Turbo | 2021 年 9 月 | 16K | 输入 0.5,输出1.5,输出 1.5 | T->T | | Anthropic | Claude 3 Haiku | 未知 | 200K | 输入 0.25,输出1.25,输出 1.25 | TI->T | | Claude 3 Sonnet | 未知 | 200K | 输入 3,输出15,输出 15 | TI->T | | Claude 3 Opus | 未知 | 200K | 输入 15,输出75,输出 75 | TI->T | | Claude 2.1 | 未知 | 200K | 输入 8,输出24,输出 24 | TI->T | | Claude 2.0 | 未知 | 100K | 输入 8,输出24,输出 24 | T->T | | Claude Instant | 未知 | 100K | 输入 0.8,输出2.4,输出 2.4 | T->T | | Google | Gemini 1.5 Flash | 未知 | 128K | 输入 0.35,输出0.53,输出 0.53 | TI->T | | Gemini 1.5 Flash | 未知 | 1M | 输入 0.7,输出1.05,输出 1.05 | TI->T | | Gemini 1.5 Pro | 未知 | 128K | 输入 3.5,输出10.5,输出 10.5 | TI->T | | Gemini 1.5 Pro | 未知 | 2M | 输入 7,输出21,输出 21 | TI->T | | Gemini 1.0 Pro | 未知 | 32K | 输入 0.5,输出1.5,输出 1.5 | TI->T | | Mistral | open-mixtral-8x7b | 未知 | 32K | 输入 0.7,输出0.7,输出 0.7 | T->T | | open-mixtral-8x22b | 未知 | 64K | 输入 2,输出6,输出 6 | T->T | | mistral-small-2402 | 未知 | 32K | 输入 1,输出3,输出 3 | T->T | | mistral-medium | 未知 | 32K | 输入 2.7,输出8.1,输出 8.1 | T->T | | mistral-large-2402 | 未知 | 32K | 输入 4,输出12,输出 12 | T->T | | Groq | LLaMA 3 70B | 未知 | 8K | 输入 0.59,输出0.79,输出 0.79 | T->T | | Mixtral 8x7B | 未知 | 32K | 输入 0.24,输出0.24,输出 0.24 | T->T | | LLaMA 3 8B | 未知 | 8K | 输入0.05,输出0.1,输出 0.1 | T->T | | Gemma 7B | 未知 | 8K | 输入 0.1,输出0.1,输出 0.1 | T->T | | 百度 | ERNIE 4.0 | 未知 | 4K | 输入 120¥,输出 120¥ | T->T | | ERNIE 3.5 | 未知 | 4K | 输入 12¥,输出 12¥ | T->T | | 腾讯 | hunyuan-pro | 未知 | 32K | 输入 100¥,输出 100¥ | T->T | | hunyuan-standard | 未知 | 32K | 输入 10¥,输出 10¥ | T->T | | hunyuan-standard-256k | 未知 | 256K | 输入 120¥,输出 120¥ | T->T | | hunyuan-lite | 未知 | 4K | 输入 8¥,输出 8¥ | T->T | | 阿里巴巴 | qwen-turbo | 未知 | 8K | 输入 8¥,输出 8¥ | T->T | | qwen-plus | 未知 | 32K | 输入 20¥,输出20¥ | T->T | | qwen-max | 未知 | 8K | 输入 120¥,输出 120¥ | T->T | | qwen-max-longcontext | 未知 | 32K | 输入 120¥,输出 120¥ | T->T | | MiniMax | abab6.5 | 未知 | 8K | 输入 30¥,输出 30¥ | T->T | | abab6.5s | 未知 | 245K | 输入 10¥,输出 10¥ | T->T | | abab6 | 未知 | 32K | 输入 100¥,输出 100¥ | T->T | | abab5.5 | 未知 | 8K | 输入 15¥,输出 15¥ | T->T | | abab5.5s | 未知 | 8K | 输入 5¥,输出 5¥ | T->T | | 零一万物 | yi-large | 未知 | 16K | 输入 20¥,输出20¥ | T->T | | yi-large-turbo | 未知 | 16K | 输入 12¥,输出 12¥ | T->T | | yi-large-rag | 未知 | 16K | 输入 25¥,输出 25¥ | T->T | | yi-medium | 未知 | 16K | 输入 2.5¥,输出 2.5¥ | T->T | | yi-medium-200k | 未知 | 200K | 输入 12¥,输出 12¥ | T->T | | yi-spark | 未知 | 16K | 输入 1¥,输出 1¥ | T->T | | yi-vision | 未知 | 4K | 输入 6¥,输出 6¥ | TI->T | | 百川智能 | Baichuan2-Turbo | 未知 | 8K | 输入 8¥,输出 8¥ | T->T | | Baichuan2-Turbo-192k | 未知 | 192K | 输入 16¥,输出 16¥ | T->T | | Baichuan2-53B | 未知 | ? | 输入20¥,输出 20¥ | T->T | | 深度求索 | deepseek-chat | 未知 | 32K | 输入 1¥,输出 2¥ | T->T | | deepseek-coder | 未知 | 16K | 输入 1¥,输出 2¥ | T->T | | 智谱 | GLM-4 | 未知 | 128K | 输入 100¥,输出 100¥ | T->T | | GLM-4(Batch) | 未知 | 128K | 输入 50¥,输出 50¥ | T->T | | GLM-4V | 未知 | 2K | 输入 100¥,输出 100¥ | TI->T | | GLM-3-Turbo | 未知 | 128K | 输入 1¥,输出 1¥ | T->T | | GLM-3-Turbo(Batch) | 未知 | 128K | 输入 0.5¥,输出 0.5¥ | T->T | | 月之暗面 | moonshot-v1-8k | 未知 | 8K | 输入 12¥,输出 12¥ | T->T | | moonshot-v1-32k | 未知 | 32K | 输入 24¥,输出 24¥ | T->T | | moonshot-v1-128k | 未知 | 128K | 输入 60¥,输出 60¥ | T->T | | 讯飞 | 星火大模型V3.5 | 未知 | ? | 输入 240¥,输出 240¥ | T->T | | 字节豆包 | Doubao-lite-4k | 未知 | 4k | 输入 0.3¥,输出 0.6¥ | T->T | | Doubao-lite-32k | 未知 | 32K | 输入 0.3¥,输出 0.6¥ | T->T | | Doubao-lite-128k | 未知 | 128K | 输入 0.8¥,输出 1¥ | T->T | | Doubao-pro-32k | 未知 | 32K | 输入 0.8¥,输出 2¥ | T->T | | Doubao-pro-128k | 未知 | 128K | 输入 5¥,输出 9¥ | T->T | | | | | | | 模态解释 | | | | | | | T:Text | | | | | | | I:Image | | | | | | | A:Audio | | | | | | | V:Video | | | | | | | E:Embedding | | | | | | | |

使用 GPT-4o 对该表格做进一步分析,绘制图表:

picture.image

picture.image

注意:本文统计数值可能会随时间波动,如需最新数据,请关注公众号私信获取。如内容有疏漏或错误,还请见谅,会在收到通知后第一时间更新。


点击下方 卡片 ,关注“ 慢慢学AIGC ”

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
云原生机器学习系统落地和实践
机器学习在字节跳动有着丰富业务场景:推广搜、CV/NLP/Speech 等。业务规模的不断增大对机器学习系统从用户体验、训练效率、编排调度、资源利用等方面也提出了新的挑战,而 Kubernetes 云原生理念的提出正是为了应对这些挑战。本次分享将主要介绍字节跳动机器学习系统云原生化的落地和实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论