Agent对于AI创业团队是一个好的方向吗？ - 文章 - 开发者社区

Agent对于AI创业团队是一个好的方向吗？作者带来一些关于AI Agent的主题思考。

最近跟不少做 Agent 的朋友聊，小团队创业就别卷 Agent 了。

按照陆奇博士的说法，做一个 Agent，要明确三件事情：职位、行业和目标 。

• 明确职位很好理解，因为不论做什么岗位，开发、销售、运营、战略，都有需要具备的基本素质，这些素质有明显的职位间差别；

• 区分行业，是因为行业知识很重要，同样是2B销售，医药领域和软件领域所需要的 domain knowledge 完全不同；


• 明确目标，定下 KPI，才能给模型做迭代和优化。

职业素养和行业知识，理想状态下，应该是被训练到模型里，让其内化的；任务目标则可以通过 prompt 的方式给到 Agent。

但诸多 Agent 团队，没有多少人真正知道在技术上怎么实现。所以大家通常采用更笨，但或许也能凑效的方法。

像微软这样的大厂，从去年ChatGPT 刚出的时候，就开始做 Agent 了，花了一年时间，才刚交付初版的垂类 Agent。用的就是最容易想到的笨办法：把工作流拆到足够细，用 LLM 大脑 + 不同小工具/小模型完成任务，构筑专家经验（数据）飞轮，形成壁垒。

这种方法的好处是也不需要对模型有什么调教，只要专家真的懂行就可以（因为精调的效果明显比RAG差）。但坏处就是，绝大部分是工作量落在专家上了。这其中，专家的行业认知主要起到两个作用：

• 一是把 Agent 的复杂任务拆解成很细的 SOP，尽可能的给每个环节定下输入、输出、衡量指标，让每个细节都规范化；
• 二是整理语料库，判断出哪些是好的语料，怎样分门别类的整理，在哪个环节应该从哪个库中 retrieve 数据/资料作为参考；

这对于小的初创团队很不友好，因为在目前的方法下，要花掉很多时间让专家做这两个工作，才可能做出好用的 Agent。

换句话说，Agent 好坏差距很大，得做出好的才行。Demo 级的玩具，用 GPTs 10 分钟就可以搭建出来，但很没用，而搭可能会好用的 Agent，要花很久时间，把流程拆细，把语料整理。但这样辛苦 10 个月做出了 Agent后，可能马上就要被新一代 LLM 的能力所代替 😮‍💨。

关于 AI 初创还能干啥，基于我们团队从 2C 的 AI 产品开始，先转到 2B 的 AI 定制开发，最后再 pivot 的路线，我在此分享一些拙见：

1. 帮企业做定制化、本地模型部署、finetuning 之类的工作。这些事情对企业来说很难有实际价值，之后模型定制化、本地部署、finetune 之类的工作一定会越来越简单，未来就是一键部署的事情。所以现在要是有老板愿意下单的话，有钱赚就赶紧赚了，但不要把这个作为中长期支柱。
1. 往向量数据库、RAG（检索增强生成）相关。这也是我们之前的主要技术方向。之前做主要是因为 LLM 上下文窗口有限，而且 token 费很贵。自己做 RAG 便宜而且效果还行。但 Gemini 100 万 token 的窗口都出来了，而且预期各家的推理成本会越来越便宜，所以我们就不把这个作为主要方向了。
1. Agent 依然不建议做，但是积累行业数据是 make sense 的 。不做 Agent 的原因同上篇，现在要让 Agent 变得有用，要投入太多工程成本了，这些成本在未来几乎都可以忽略不计。但不管工程方面的问题，Agent 是依赖于数据的：

• 一方面是岗位数据，让 Agent 具有基本的岗位素养，比如像产品经理/程序员/老师一样思考。但这个事情创业团队做很不划算，因为岗位 Agent，OpenAI 肯定会做 ，他们一定会把最常见的智力劳动累岗位 Agent 训练出来。
• 另一方面就是行业数据，让 Agent 具有行业经验，这也是 OpenAI 不会做的 。比如，他们即便可以培养一个精通营销知识的 Agent（相当于一个成绩优异，从营销专业毕业的学生），但要让这个 Agent 在新零售行业，或者 Web3 做得很好，那还需要新零售/web3的行业常识。这种行业数据是 OpenAI 没有的，因此他们搞不定这个。

所以说，现在可以做的事是苟着，深植一个行业，积累独家行业数据，当 OpenAI 把 Agent 的训练变得很方便时，把积累的数据用上，低成本的做出好用的 Agent。（而不是现在以更笨、更脏活的方式去搭不太有用的 Agent。）

关于多模态、AI 硬件、具身智能等等方向俺都不是很了解，欢迎大家补充交流。

最后有一些精选的留言：

• 做tob的死了这条心吧。tob企业被各大公司抢光了。你能拼得过。我司就是。基本上现在全面铺开，啥模型都有，要啥效果都可以给。@closer'
• Domain knowledge训练到模型里，让其内化，这个说起来很美好，实际上非常难做，如果你的domain knowledge是LLM在pretrain阶段100%绝对没见过的知识，而你的数据量又达不到pretrain最起码的要求时，这个问题会很严重——在比较浮躁的公司里，大部分这种难啃的问题，最后都会变成一堆人围绕sft做各种prompt的伪科学，agent本身也是伪科学，做agent就像一群凡人对着一个不知道存在不存在的名为LLM的神祈祷一样的事情。@InsomniaSnow
• 普通创业者不卷agent能卷啥，不可能所有人都搞高大上的项目。很多带着dirty work属性的agent，大公司看不上也不会投资源去做的，这个是普通人的机会。@逸樾

PS：给公众号添加【星标⭐️】不迷路！您的点赞、在看、关注是我坚持的最大动力！

欢迎多多关注公众号「NLP工作站」，有问题的朋友也欢迎加我微信「logCong」私聊，交个朋友吧，一起学习，一起进步！我们的口号是“生命不止，学习不停”！

往期推荐：