Ta 们是全球AI应用新生的学习榜样

火山方舟向量数据库大模型

1. 引言

作为硅谷最大的天使投资机构,Y combinator在上周公布了260个2024年冬季营项目,其中大约170+项目和AI相关,而这些项目一定程度上代表着市场趋势,同时我们也能找到一些好学生榜样,帮助自我进步。

我在第一时间对这些项目进行了盘点,整理过程中发现2023年夏季营的项目也逐渐趋于成熟,所以今天就和大家看看这两季的项目,向全球的“好学生”学习。

picture.image

在开始之前,首先简要介绍一下YC:

Y combinator 成立于 2005 年,主要投资早期项目,曾孵化了 Airbnb、Dropbox、Reddit 等知名公司,OpenAI CEO Sam Altman 曾在 2014-2019 年担任 YC 的 CEO。YC 每年有夏冬两季创业营,入营后,YC 会有资金支持(参考国内奇绩论坛 200 万美元兑换 7%股权),同时会有三个月的时间在创业营接受经验丰富的导师和行业专家的一对一指导。结营时,YC 会举办 Demo Day,创业者有机会向投资者展示他们的产品和服务,寻求进一步的融资和合作机会。

接下来我们就来看看这些好学生长啥样,我们如何去学习。

2. YC 的 260 个项目中洞察三个 AI 发展趋势

我在YC官网上过滤出23S和24W(2023夏季营和2024冬季营)且标签中含AI的项目,总共得到267个。所有项目的中文介绍都总结在表格里了(公众号发消息“YC2024”即可获得),在这篇文章里和大家分享从中洞察的几个趋势,某些优秀项目后续会以视频的方式和大家分享。

注:后来发现漏掉了10几个项目,不过这并不影响整体趋势的洞察.

2.1 技术趋势:Agent 技术成为本期重点

在阅览所有项目后,我对这些项目所使用的技术进行了简单推演,整体的统计结果是这样的:

picture.image

可以看出:

  1. Agent 技术 占据主导地位 ,使用率远超其他技术,达到 214 个项目。套用吴恩达最新的演讲,Agent 是指能进行自主规划,使用工具,反思和协作的智能体框架。在我看来Agent 更像是让 AI 落地的执行者,是应用和技术的粘合剂,所有AI的从业者都应该关注这一技术,推荐大家阅读Agent调研--19类Agent框架对比
  2. Multimodal :多模态技术位居第二,29 个项目主要提供图像、语言、视频生成能力。

注:很多产品同时在使用Agent+多模态,但为了统计方便,仅仅将产品中主要使用的技术计入考虑。比如某个用于理解研究报告的产品会同时使用 Agent + Multimodal,但其主要使用的是 Agent 技术,那么这个产品就会被列入 Agent 技术中,而没有列入到使用 Multimodal 的统计中。 3. Infra :基础设施技术,主要指为 AI 应用开发提供的基座能力的技术,比如 AI 应用的评测、监控,帮助提升 AI 应用开发速度、性能,基座模型等。总共有 14 个项目。

  1. RAG 即检索增强生成 : 仅仅有 5 个项目主要使用 RAG 技术。当然这并不意味着 RAG 没有用处,只是不再像之前那样受人瞩目。我个人认为两个原因:

一是因为 RAG 早已通过各种方式融入为产品的基本能力;

二是模型长上下文的支持和 RAG 本身的局限(比如对多模态的支持差),使得 RAG 的生存空间被大大挤压。 5. 机器人 :主要指包含硬件产品,对 CV, LLM, 控制等技术的综合使用,总共入营 4 个项目。

  1. 区块链 :仅有一个项目入营,可见 2017 年的区块链的光环已经被 AI 取代。之所以列出来是因为区块链作为一项可以保障安全和产权的技术在未来一定会结合使用。

聊完技术趋势接下来看看哪些场景应用 AI 比较多。

2.2 领域趋势:挖矿的比造铲子的人多了;B 端比 C 端多;程序员正在革自己的命。

根据不同领域我做了如下统计。

picture.image

我们将这些领域进行分层,然后再对上图信息进行可视化的优化,可读性瞬间增强。

picture.image

上图中气泡大小代表该领域的项目数量,色系代表不同类型的应用。

我们从下到上, 从左往右看,

  1. 首先,如图底部是基础工具,很明显的看出 应用远多于基础工具 ,意味着 造铲子的人少了,挖矿的人多了 ,这是符合所有技术革命进入应用爆发时代的特征。
  2. B 端应用远多于 C 端应用。

在应用层,绿色+黄色系代表B端应用,可以看出远多于C端应用。这颠覆了我之前的思路:我们从移动互联网走来,有一种惯性思维是一定会有一个面向 C 端的 super app,但最近 Open AI 联合创始人 Andrej Karpathy 在一次访谈中提到的:

“大模型≈操作系统+CPU”

突然让我觉得现在更像 PC 机上刚刚支持 GUI(图形界面)+鼠标的时代。那时电脑不再是科学家的工具,普通人也可以操作了,但最大的问题就是,大众不知道该拿电脑干啥,同时机器性能也跟不上,这直接导致 1984 年乔布斯创造的第一台 GUI+鼠标的 PC 机 Macintosh 不被市场接受,而直到95年,Windows 的 GUI PC 机才开始盛行, 这期间整整持续了10年

picture.image

这种窘境就特别像当下感受:人们似乎觉得自然语言可以编程,但人们就是不知道可以干啥,且LLM目前对视频的理解也和普通人的期待有差距。当然历史不可能完全重复,我们目前看到模型的性能在飞速提高,但什么时候才能出来 super app,我自己拍脑袋的判断是还需要2-3年。在这之前,Native的AI应用首先是在B端赚到钱。那么在B端应用大家在做啥呢

。 3. 第一件事就是:“程序员在革自己的命”。

这是 一个程序员朋友看到这张图的第一句 话,主 要原因是互联网从业者是仅次于 AI 研究员之后的第二批 AI 重度用户,这帮人也最会解决自己的领域,除了 code copilot 之外,还诞生了各个垂直环节的产品,比如 AI Agent bug 修复,AI 代码审查,AI 自动化测试,AI 对话写前端页面等等。

  1. 第二件事是: 数字化程度高的产业(医疗除外)最先被选中 进行 AI 改造,比如金融、电商、CRM。而医疗之所以能被AI改造部分原因是其中的痛点多,且医疗行业出于安全考虑,自动化程度很低,而AI有望能解决过去的技术所不能解决的痛点。
  2. 泛应用中,Agent 开发成为一股新势力

,某种程度上也印证了 Agent 技术的流行。 这里的 Agent 开发更像是 AI 版本的 RPA,给传统 RPA 注入了理解、总结等能力。

上图中所有项目详细列表我已经整理成表格,通过 Domain 这一列过滤即可。

picture.image

看完AI落地场景,最后聊一下是什么样的人在做这些事。

2.3 人才趋势:大量工程师入场

刚刚说的程序员开始革自己的命,我们看到了大量的工程师入场,比如前端工程师将前端页面组件化后,通过对话让AI自己写页面。java开发工程师让AI自己解bug,写接口。

picture.image

同时最近也接触到几个正在向 AI 方向转型的产品经理最近收到了不少面试机会(两周有六七个),且已经拿到保底 offer。和同龄段还在互联网行业找工作的同学相比,确实多了很多机会。

最后和大家总结一下。

3. 总结

AI 依赖 Agent技术 越来越融入 丰富的场景 ,且由此带来了 AI 参与者的一个巨大变化: 从 LLM 早期的以研究者为主,已经转向了普通开发者

在这次调研中,我也看到了非常多优秀的产品,其中会挑一些有意思的产品和大家以视频或者直播的方式分享,敬请期待。

最后,如果想看我总结的表格,公众号 回复“YC2024” 即可获得。

picture.image


我是关注AI产品的产品二姐,致力于带来丰富的 AI 学习分享、体会,欢迎 你和我一起学习,如果你觉得文章有用,欢迎关注、点赞、转发。

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论