Agent对于AI创业团队是一个好的方向吗?

Agent对于AI创业团队是一个好的方向吗?作者带来一些关于AI Agent的主题思考。

最近跟不少做 Agent 的朋友聊,小团队创业就别卷 Agent 了。

按照陆奇博士的说法,做一个 Agent,要明确三件事情:职位、行业和目标

• 明确职位很好理解,因为不论做什么岗位,开发、销售、运营、战略,都有需要具备的基本素质,这些素质有明显的职位间差别;

• 区分行业,是因为行业知识很重要,同样是2B销售,医药领域和软件领域所需要的 domain knowledge 完全不同;


• 明确目标,定下 KPI,才能给模型做迭代和优化。

职业素养和行业知识,理想状态下,应该是被训练到模型里,让其内化的;任务目标则可以通过 prompt 的方式给到 Agent。

但诸多 Agent 团队,没有多少人真正知道在技术上怎么实现。所以大家通常采用更笨,但或许也能凑效的方法。

像微软这样的大厂,从去年ChatGPT 刚出的时候,就开始做 Agent 了,花了一年时间,才刚交付初版的垂类 Agent。用的就是最容易想到的笨办法:把工作流拆到足够细,用 LLM 大脑 + 不同小工具/小模型完成任务,构筑专家经验(数据)飞轮,形成壁垒。

这种方法的好处是也不需要对模型有什么调教,只要专家真的懂行就可以(因为精调的效果明显比RAG差)。但坏处就是,绝大部分是工作量落在专家上了。这其中,专家的行业认知主要起到两个作用:

  • • 一是把 Agent 的复杂任务拆解成很细的 SOP,尽可能的给每个环节定下输入、输出、衡量指标,让每个细节都规范化;
  • • 二是整理语料库,判断出哪些是好的语料,怎样分门别类的整理,在哪个环节应该从哪个库中 retrieve 数据/资料作为参考;

这对于小的初创团队很不友好,因为在目前的方法下 ,要花掉很多时间让专家做这两个工作,才可能 做出好用的 Agent。

换句话说,Agent 好坏差距很大,得做出好的才行。Demo 级的玩具,用 GPTs 10 分钟就可以搭建出来,但很没用,而搭可能会好用的 Agent,要花很久时间,把流程拆细,把语料整理。但这样辛苦 10 个月做出了 Agent后,可能马上就要被新一代 LLM 的能力所代替 😮‍💨。

关于 AI 初创还能干啥,基于我们团队从 2C 的 AI 产品开始,先转到 2B 的 AI 定制开发,最后再 pivot 的路线,我在此分享一些拙见:

    1. 帮企业做定制化、本地模型部署、finetuning 之类的工作。这些事情对企业来说很难有实际价值,之后模型定制化、本地部署、finetune 之类的工作一定会越来越简单,未来就是一键部署的事情。所以现在要是有老板愿意下单的话,有钱赚就赶紧赚了,但不要把这个作为中长期支柱。
    1. 往向量数据库、RAG(检索增强生成) 相关。这也是我们之前的主要技术方向。之前做主要是因为 LLM 上下文窗口有限,而且 token 费很贵。自己做 RAG 便宜而且效果还行。但 Gemini 100 万 token 的窗口都出来了,而且预期各家的推理成本会越来越便宜,所以我们就不把这个作为主要方向了。
    1. Agent 依然不建议做,但是积累行业数据是 make sense 的 。不做 Agent 的原因同上篇,现在要让 Agent 变得有用,要投入太多工程成本了,这些成本在未来几乎都可以忽略不计。但不管工程方面的问题,Agent 是依赖于数据的:
  • • 一方面是岗位数据,让 Agent 具有基本的岗位素养,比如像产品经理/程序员/老师一样思考。但这个事情创业团队做很不划算,因为岗位 Agent,OpenAI 肯定会做 ,他们一定会把最常见的智力劳动累岗位 Agent 训练出来。
  • • 另一方面就是行业数据,让 Agent 具有行业经验,这也是 OpenAI 不会做的 。比如,他们即便可以培养一个精通营销知识的 Agent(相当于一个成绩优异,从营销专业毕业的学生),但要让这个 Agent 在新零售行业,或者 Web3 做得很好,那还需要新零售/web3的行业常识。这种行业数据是 OpenAI 没有的,因此他们搞不定这个。

所以说,现在可以做的事是苟着,深植一个行业,积累独家行业数据,当 OpenAI 把 Agent 的训练变得很方便时,把积累的数据用上,低成本的做出好用的 Agent。(而不是现在以更笨、更脏活的方式去搭不太有用的 Agent。)

关于多模态、AI 硬件、具身智能等等方向俺都不是很了解,欢迎大家补充交流。

最后有一些精选的留言:

  • • 做tob的死了这条心吧。tob企业被各大公司抢光了。你能拼得过。我司就是。基本上现在全面铺开,啥模型都有,要啥效果都可以给。@closer'

  • • Domain knowledge训练到模型里,让其内化,这个说起来很美好,实际上非常难做,如果你的domain knowledge是LLM在pretrain阶段100%绝对没见过的知识,而你的数据量又达不到pretrain最起码的要求时,这个问题会很严重——在比较浮躁的公司里,大部分这种难啃的问题,最后都会变成一堆人围绕sft做各种prompt的伪科学,agent本身也是伪科学,做agent就像一群凡人对着一个不知道存在不存在的名为LLM的神祈祷一样的事情。@InsomniaSnow

  • • 普通创业者不卷agent能卷啥,不可能所有人都搞高大上的项目。很多带着dirty work属性的agent,大公司看不上也不会投资源去做的,这个是普通人的机会。@逸樾

PS:给公众号添加【星标⭐️】不迷路!您的点赞、在看、关注是我坚持的最大动力!

欢迎多多关注公众号「NLP工作站」,有问题的朋友也欢迎加我微信「logCong」私聊,交个朋友吧,一起学习,一起进步!我们的口号是“生命不止,学习不停”!

往期推荐:

0
0
0
0
评论
未登录
暂无评论