像原始人一样和AI对话，费用可直接砍掉40% - 文章 - 开发者社区

picture.image

如果你经常用ChatGPT API或者其他大模型，月底账单可能让你心疼。现在有个开源项目叫"caveman-compression"，能帮你省下不少钱。

到底怎么省钱的？

原理很直接：把废话删掉，关键信息留着。

举个例子：

  
原文：为了优化数据库查询性能，我们应该考虑在经常访问的列上实现索引...  
压缩：需要快速查询。检查哪些列用得最多。给这些列加索引...

同样的意思，token少了29%。费用直接打7折。

压缩原理揭秘

picture.image

这个方法基于一个关键发现：大模型本身就擅长填补语言空白，能自动补全缺失的语法和连接词。

会被删掉的（机器能补全的） ：

语法词："a"、"the"、"is"、"are"
连接词："therefore"、"however"、"because"
被动语态："is calculated by"
填充词："very"、"quite"、"essentially"

会被保留的（机器猜不到的） ：
具体数据：数字、姓名、日期
专业术语："O(log n)"、"binary search"
限定词："medium-large"、"frequently accessed"
特定信息："Stockholm"、"99.9% uptime"

举个实际例子：

  
压缩前："Company medium-large. Location Stockholm."  
机器理解："at a medium-large company based in Stockholm"

机器自动加上了语法，但事实信息一点没变。

两种压缩方式，按需选择

方式一：调用OpenAI压缩

省钱效果：40-58%
缺点：需要API key，每次压缩要花点钱
适合：对压缩率要求高的场景

方式二：本地NLP压缩
省钱效果：15-30%
优点：完全免费，不联网，支持中文
适合：大批量处理或预算紧张

实际能省多少钱？

作者测试了几种常见场景：

系统提示词 ：171个token → 72个token（省58%）
API文档 ：137个token → 79个token（省42%）
用户简历 ：201个token → 156个token（省22%）

如果你每月API费用1000块，用了这工具可能直接降到600块。

什么情况下有用？

特别适合 ：

内部文档处理
批量数据分析
AI Agent的内部推理
需要塞很多背景信息的场景

别用在 ：
给客户看的内容
营销文案
正式合同
需要情感表达的文字

怎么开始用？

如果要最大压缩率 ：

  
git clone https://github.com/wilpel/caveman-compression  
pip install -r requirements.txt  
# 配置你的OpenAI API key  
python caveman_compress.py compress "你的文本"

如果要免费使用 ：

  
pip install -r requirements-nlp.txt  
python -m spacy download zh_core_web_sm  # 中文支持  
python caveman_compress_nlp.py compress "你的文本"

靠谱吗？

作者做了测试，压缩前后的关键信息100%保留。而且大模型本来就擅长理解这种"电报体"文字。

不过说实话，压缩后的文字确实像原始人说话。但对机器来说没问题，核心意思都在。

谁在用？

这种思路其实挺实用的。特别是那些需要处理大量文档、频繁调用API的开发者。比如做RAG系统的，把知识库压缩一遍，查询效率能提升不少。

还有做AI Agent的，让Agent内部推理用这种格式，同样的上下文窗口能塞进更多思考步骤。

值得试试吗？

如果你的API账单让你肉疼，这个工具值得一试。MIT开源协议，代码透明，风险不大。

最坏情况就是压缩效果不理想，但至少能让你对token优化有些新思路。毕竟在AI越来越贵的今天，能省一点是一点。

项目地址：https://github.com/wilpel/caveman-compression

关注公众号回复“进群”入群讨论