年底了,回顾这一年的变化,不管是自己,还是AGI(通用人工智能)赛道,都有点恍惚和神奇。年初还是一如以前,到了年底就发现你能让计算机做些以前想象不到的事情,比如:
-
给段话能画个图,做个视频。
-
提个问题能自己回答。
-
时不时的还能和数字人对个话。
但当我试图去总结这一年人工智能领域的大语言模型的重大事件时,发现这真是个浩大的工程,即使借助AI工具也没达到我想要的效果(可见AI落地还有距离)。不过仔细回顾,你会发现在这些纷繁复杂的事件背后,其实都是由几件事情在引领,他们就像平静水面上扔下去的石头,而其他事情就是水面泛起的涟漪。
1. 第一次大事件是2022年底的GPT3.5
最开始是从投资界开始关注,一些重量级的投资人看完ChatGPT都是激动万分,感慨着第四次工业革命时代的到来。于是在2023年开端1月-3月:大家都在探索LLM(大语言模型)是个啥东西。
2. 紧接着3月GPT4发布,是第二次“** 一石激起千层浪**”** 。**
在GPT-4的刺激下,3-7月,LLM(大语言模型)玩家陆续进场,这其中包括3月发布的Claude1.0(由Open AI离职员工创办的公司), 5月 google I/O大会发布的临时应对方案:PaLM2+升级版Bard12,其次还有玩各种垂直模型的玩家。以至于到了7月份,国内上演“百模大战”。但纷纷下水的LLM玩家最终发现无论自己怎么玩都玩不过OpenAI。于是乎...
3. Meta索性开源Llama2,是第三次“** 一石激起千层浪**”**** 。
Meta Llama 2一开源,惠及千万家。7-9月国内大模型纷纷发布,至于这些大模型是不是底层套的Llama 2 ,我们不做讨论,但至少像李开复这样的顶尖团队也是”婉转“的承认了使用Llama 2,估计大部分都Llama 2。
同时由于Llama 2 的开源,使LLM这把“锤子”的门槛大大降低,各家都号称自己拥有核心技术,不必再100%依赖Open AI。一旦拥有了锤子,大家就开始纷纷抡着锤子找钉子。这期间也诞生了不少应用,越来越多的创业公司逐渐拿到融资。但到底有多实用,还很难说。
4. 11月GPT Turbo4+GPTs是第四次“一石激起千层浪”
11月OpenAI召开第一次开发者大会,会上发布GPT turbo 4,以及GPTs(被创业者认为是断了创业者退路的GPT store)。紧接着12月Google 发布Gemini,算是对GPT4的全力应对。而各种AI原生应用开始诞生,甚至我身边就能找到在创业且产品已经上线的朋友。
回顾完了过去一年,再来展望一下2024年。
- 展望2024
先说我的观点:2024 是AI领域应用大爆发的一年。
原因有以下几点:
- 市场诉求强烈。
我作为一个极其普通的行业参与者,最近感觉周围人有越来越多的人开始关注如何将AI应用到自己的生意中,这其中有做跨境电商的,有开绘本馆的,有做各种咨询服务的。 2. 算力成本明年会下降。
除英伟达之外,各大厂也早就布局芯片研发,尤其是开始研发专门用于Transformer(大模型的核心算法)计算芯片。而今年我们去和中小企业聊,一次性的部署成本大家尚可接受,但一听大模型的消耗,纷纷摇头。依据我们在使用文心一言大模型时的体验,大概100万Token也就能支持一百次提问,而文心官网上每个月20万token + 1000A币原价是99元,远远高于中小企业能承担的成本。如果算力成本降下来,我想可能不少企业会开始考虑使用。
注:当然token的计算是个非常复杂逻辑,各个大模型厂商的计算消耗也都不一样。这里提到的数据仅供参考 3. 开源会让各厂商和Open AI的距离会逐渐缩小。
如果把open AI比作移动互联网时代的苹果,那么开源的LLM就是移动互联网的Android。今天OpenAI是一骑绝尘,遥遥领先,但LLM依赖的算法对于open AI和开源LLM其实是一致的。深度学习的算法本身也有一定的局限性,这意味着LLM的发展一定会有瓶颈,当open AI遭遇瓶颈之时,也是各路开源LLM追赶的好时机,最终二者可能拉平,并驾齐驱。
很庆幸能赶上移动互联网和AI这两波热潮,希望大家明年再接再厉,我们明年见!
我是关注AI产品的产品二姐,致力于带来丰富的AI学习分享、体会,欢迎你和我一起学习,如果你觉得文章有用,欢迎关注、点赞、转发。