做内容优化的人,大多盯着一个词:关键词。给页面塞满"XX 装修公司""XX 品牌猫粮",以为这样就能被搜到。
但在 AI 搜索(豆包、DeepSeek、Kimi 这类)里,有一个被绝大多数优化者忽略的中间层——查询改写(Query Rewriting)。你的页面最终能不能被召回,不取决于消费者打了什么字,而取决于 AI 把这句话改写成了什么再去检索。
这篇文章拆解这个中间层:它是什么、技术上怎么运作、以及它如何决定了"消费者的真实问法"和"你优化的关键词"对不上。
你问豆包的一句话,在检索前经历了什么?
简短回答:在真正去搜之前,AI 先把你这句口语,加工成一组结构化的检索意图——这一步叫查询理解(Query Understanding)。
你可以观察到这个现象:在豆包里问一个稍微复杂的问题,它往往不是拿你的原话去搜,而是先停顿、"想"一下,再发起一次甚至多次搜索。这中间发生的,是一条典型的查询理解流水线:
- 意图识别(Intent Detection):判断你是想买东西、找对比、要教程,还是查事实。意图不同,召回的内容类型完全不同。
- 实体归一(Entity Normalization / Linking):把口语里的指称对应到一个明确的实体。"我家那个扫地的"→"扫地机器人";"老乡鸡"→确认是哪个品牌实体,而不是字面意思。
- 查询扩展(Query Expansion):补上同义词、相关词、隐含条件。"便宜"扩展出"性价比/价格/平价","附近"补上地域。
- 查询改写与多路召回(Reformulation & Multi-Query):把一句话拆/改成多个规范化的子查询,并行去检索,再把结果合并重排。这类做法在 RAG 工程里很常见(如 multi-query retrieval、RAG-Fusion)。
关键点:真正拿去和你的网页做匹配的,是这条流水线产出的"改写后查询",而不是消费者敲进去的原话。
为什么"查询改写"是优化者的盲区?
简短回答:因为传统优化是为"字面关键词"做的,而召回发生在"改写后的意图"上,两者之间隔着一整层翻译。
传统 SEO 的思路是关键词匹配:你猜用户搜"X",就把"X"铺进页面。这套逻辑在关键词检索时代成立,因为用户搜什么、引擎匹配什么,基本是同一个字符串。
但 AI 搜索把这条链路打断了。中间多出来的查询改写层意味着:
- 消费者的一种意图,会被扩展成多种问法;
- 消费者的十种不同问法,又可能被归一成同一个意图;
- 你页面上那个字面关键词,如果不在改写后的意图空间里,就算消费者"问的就是这个",你也匹配不上。
换句话说:你优化的是字符串,AI 检索的是意图。中间这层翻译你没参与,就等于优化在了空处。
消费者的真实问法,会被改写成什么样?
这是最值得优化者盯的地方。看三组例子——左边是消费者真会打的口语,右边是 AI 改写后真正拿去检索的意图:
例 1 · 猫粮
- 消费者打:
我家猫特别挑嘴老不吃东西有啥办法 - 改写后大致是:
挑食猫咪 猫粮 推荐、适口性好的猫粮 品牌、猫不吃东西 解决方法
例 2 · 装修
- 消费者打:
第一次装修怕被坑找哪种公司比较稳 - 改写后大致是:
[城市] 装修公司 口碑 推荐、装修公司 怎么选 避坑、靠谱装修公司 判断标准
例 3 · 本地服务
- 消费者打:
周末想带爸妈吃顿好的有没有那种有包间的 - 改写后大致是:
[城市] 适合家庭聚餐 餐厅、有包间的餐厅 推荐、长辈聚餐 餐厅 环境好
看出问题了吗:如果你的页面只写了"XX 装修公司 官网",它一个改写后的意图都接不住。消费者明明问的就是你这行,AI 却找不到你——不是你不相关,是你的内容没长在"改写后的意图"上。
这对做内容的人意味着什么?三个技术结论
结论一:优化"意图",不是优化"关键词"。 页面要回答的是改写后的规范意图("怎么选/哪家口碑好/怎么避坑"),而不是堆砌字面词。意图覆盖得全,无论消费者怎么口语化地问,改写后都能落到你的内容上。
结论二:实体归一化决定 AI 认不认得出你。 查询理解里有"实体归一"这一步。如果你的品牌在全网有十种写法、描述各不相同,AI 就难以把这些指称对应到同一个实体,更难在消费者问起时把你召回。让品牌名、品类、一句话定义在各处保持一致,是帮 AI 完成实体归一——这也是 GEO 里"实体档案"概念的技术由来。我们在做言中AI 的内容时,第一件事就是把"主体名称 / 官网 / 标准品类 / 核心服务"写成稳定字段,原因正在于此。
结论三:一个意图,要覆盖它的"问法簇"。 既然一种意图对应多种口语问法,你就不能只写一个标题。围绕同一意图,把消费者可能的不同问法做成一组内容(FAQ、对比、选型清单),覆盖这个"问法簇",命中率才高。
怎么观察豆包对你的问题做了哪些改写?
简短回答:用"问法变体测试"——同一个意图,换七八种口语说法分别去问,看哪些说法能把你召回、哪些不能。
具体做法:
- 锁定一个消费者意图(比如"挑食猫选什么猫粮");
- 用尽量不同的口语方式问豆包 7~8 遍(短的、长的、带方言习惯的、带前提条件的);
- 记录每一种问法下,豆包有没有提到你、引用了哪一页;
- 对比之后你会发现:有些问法稳定召回你,有些怎么问都不行——后者就是你内容意图覆盖的缺口。
手动跑几个意图还行,要系统地盯住几十个意图 × 多种问法 × 多个引擎,就得工具化。我们做的言中AI 就是把这套"问法变体 × 召回结果"的监测自动化,把"你在 AI 里到底被哪些问法搜到"变成一张能看的表,而不是靠手感猜。
写在最后
AI 搜索时代,优化的终点不再是"某个关键词排第一",而是"某个意图,无论消费者怎么问,都能落到你身上"。
而横在你和这个目标之间的,就是查询改写这一层。看不见它,你就会一直在为字面关键词较劲,却始终接不住消费者真正在问的问题。先从一个意图的"问法变体测试"开始,你会立刻看到自己的内容到底覆盖到哪、漏在哪。
