本文转自
Andrej Karpathy
改变世界的科技通常遵循自上而下的传播路径:起源于政府或军事背景,经过企业,最终到达个人——想想电力、密码学、计算机、飞行、互联网或 GPS。这种发展进程看起来很直观,新的、强大的技术通常稀缺、资本密集,在早期阶段需要专业的技术知识。
因此,在我看来,LLMs 显示出这种模式的戏剧性逆转——它们为普通人带来不成比例的好处,而它们在企业和政府中的影响则要微弱得多,滞后得多。ChatGPT 是历史上增长最快的消费应用,拥有 4 亿每周活跃用户,他们用它来写作、编码、翻译、辅导、总结、深入研究、头脑风暴等。这不是对之前存在的应用的微小升级,而是对个人在广泛能力范围内的力量水平的重大倍增器。而且使用门槛极低——模型成本低(甚至免费),速度快,任何人都可以通过 URL(甚至本地机器)随时访问,并且它们能说任何人的母语,包括语气、俚语或表情符号。这太疯狂了。据我所知,普通人从未经历过如此戏剧性、如此快速的科技解锁。
为什么在企业,这些好处却显得微不足道?我认为第一个原因是LLMs提供了一种非常具体的技能组合——仅仅是准专家的知识/表现,但同时又跨越了非常广泛的领域。换句话说,它们既灵活又肤浅,且容易出错。与此同时,一个组织的独特优势是通过雇佣工程师、研究人员、分析师、律师、营销人员等,将多样化的专业知识集中到一个实体中。虽然LLMs当然可以使这些专家在个人层面上变得更加高效(例如起草初步法律条款、生成模板代码等),但组织改进的形式只是使其在原本就能做的事情上变得更好。相比之下,个人通常最多只精通一件事,因此LLM提供的广泛准专业知识从根本上使他们能够做以前做不到的事情。人们现在可以 vibe 代码应用。他们可以处理法律文件。他们可以理解深奥的研究论文。他们可以进行数据分析。他们可以生成用于品牌和营销的多模态内容。 它们可以在不涉及额外专家的情况下,以足够的性能完成所有这些工作。
其次,组织需要处理更复杂的问题和必要的协调,例如:各种集成、遗留系统、企业品牌或风格指南、严格的保密协议、隐私考虑、国际化、法规遵从和法律风险。变量、约束和考虑因素更多,错误容忍度更低。将这些内容放入上下文窗口并不容易。你不能只是随意编写代码。你可能会因为一次灾难性的幻觉而失去工作。第三,大型组织存在已知的惯性,包括文化、历史先例、在快速变化时期的政治领地、沟通成本、分布式工作团队的再培训挑战和传统的官僚主义。当涉及到快速采用一个新颖、多才多艺但浅薄且易出错的新工具时,这些都是巨大的逆风。 我不希望低估LLMs在企业和政府中的影响,但至少目前,从整个社会的角度来看,它对个人的影响远远大于对组织的影响。玛丽、吉姆和约瑟夫们是主要受益者,而不是谷歌或美国政府。
展望未来,LLMs 的持续扩散当然取决于持续的性能改进和其能力特征。总体而言,“利益分配”特别有趣,并且高度依赖于性能作为资本支出的函数的动态范围。今天,前沿级别的 LLM 性能非常易于获取且价格低廉。超出这一点,你无法通过增加边际美元来获得更好的性能、可靠性和自主性。金钱无法买到更好的 ChatGPT。比尔·盖茨像你一样与 GPT 4o 交谈。但这是否可以持续?训练时间扩展(增加参数、数据)、测试时间扩展(增加时间)和模型集成(增加批量)是增加动态范围的力。另一方面,模型蒸馏(通过训练来模仿大模型以训练出不成比例强大的小型模型的能力)是一种减少动态范围的力。当然,当金钱可以买到显著更好的 ChatGPT 时,事情就会改变。大型组织可以集中他们庞大的资源来购买更多的智能。 在“个人”这一类别中,精英阶层也可能再次与社会其他成员分离。他们的孩子将由 GPT-8-pro-max-high 辅导,而你则由 GPT-6 mini 辅导。
但至少在这个时刻,我们发现自己处于技术历史上的一个独特且前所未有的情况。如果你回顾各种科幻作品,你会发现几乎没有预测到 AI 革命会以这种进步的方式展开。它本应是一个绝密政府超级大脑项目,由将军们掌握,而不是 ChatGPT 一夜之间免费出现在每个人的口袋里。还记得威廉·吉布森的那句名言 "未来已经到来,只是分布不均" 吗?
惊喜——未来已经到来,而且分布得惊人。赋予人民力量。 我个人 ,非常喜欢。