点击下方 卡片 ,关注“ 慢慢学AIGC ”
前言
今天,我们庆祝 Meta 基础人工智能研究(FAIR)团队成立 10 周年——这是一个通过开放研究推进人工智能前沿的十年。在过去的 10 年里,人工智能领域经历了深刻的变革,在这整个过程中,FAIR 一直是许多人工智能突破性研究成果的源泉,也是以开放和负责任的方式进行研究的灯塔。
正是 FAIR 对责任、开放和卓越的坚持,6 年前吸引了我来到这里。像许多其他人一样,我被在一种尊重和正直的文化氛围中与世界顶尖研究人员一起工作,并怀着改变世界的雄心进行人工智能研究的前景所吸引。从那时起,我就再也没有回头。当然,我并不是第一个来到这里的人——在我之前,就已经有不少博学之士在 Meta 工作。
过去十年
FAIR 的创立可以追溯到 2013 年年底。在那些日子里,就像今天一样,对人工智能人才的竞争异常激烈。马克·扎克伯格亲自前往 NeurIPS 大会,说服研究人员加入这个新的研究组织。他与副总裁兼首席人工智能科学家杨立昆(Yann LeCun)合作,召集了一支由深度学习这一新兴领域中最有才华的研究人员组成的团队。多年来,数以百计的杰出思想家,进行前沿创新研究并产生深远影响,已加入到这一努力中,使我们能够在人工智能许多最棘手的问题上取得进展。
回顾一个十年的进步是多么令人着迷啊。以目标检测为例。10 多年前,神经网络第一次能够识别图像中成千上万种物体,这是 AlexNet 的作用。2015 年,Faster RCNN 为我们带来了实时目标检测,2017 年出现了利用 Mask R-CNN 进行实例分割的方法,2019 年则推出了用于实例和语义分割的统一架构:全景特征金字塔网络(Panoptic FPN)。在仅仅 7 年的时间里,FAIR 为解决人工智能最基础的问题做出了巨大贡献。到了 2023 年,我们甚至可以分割出任何事物。这些时间点都直接导致了若干下游应用和产品的突破性进展,不仅造福于我们 Meta 的同事,也惠及世界各地的人们。
当下
对于研究影响力来说,这确实是 FAIR 辉煌的一年。我们在年初发布了 Llama,一个开源预训练的大型语言模型。紧接着是其他一些突破性发布,将人工智能前沿推进到我们此前难以想象的地步。我们的研究成果和研究人员在多个会议上赢得了最佳论文奖,包括 ACL、ICRA、ICML 和 ICCV,涵盖了人工智能研究的大多数子领域。我们的工作在世界各地的新闻媒体上受到关注,并在社交媒体平台上被转发了数百万次。Meta 全面参与到了 Llama 2 的开源策略中。在 Connect 大会上,我们展示了新的人工智能产品和体验,如今已经投放到了数百万人手中——这是早期研究工作的结晶,随后被 Meta 的生成式人工智能和产品团队放大了。
这股势头看起来没有放缓的迹象。今天,我们宣布了涵盖音频生成、翻译和多模态感知的新模型、数据集和更新。作为 Voicebox 的继任者,Audiobox 推进了音频生成式人工智能,整合了语音、音效和声音景观的生成和编辑功能,并且支持包括自然语言提示在内的各种输入机制。在我们的无缝机器翻译(SeamlessM4T)工作的基础上,无缝套件介绍了一系列人工智能语言翻译模型,可以保留表达方式并提高流畅性。Ego-Exo4D 则在我们以往的以自我为中心的感知工作基础上进行了扩展,推出了一个包含自我视角和外部视角的基础数据集和基准测试套件。自我视角显示了参与者的观察视角,而外部视角则揭示了周围场景和上下文。这两种视角共同为人工智能模型打开了了解复杂人类技能的新窗口。
Meta 独有能力去解决人工智能最大的问题——没有多少公司有资源或能力在软件、硬件和基础设施上进行我们这样的大规模投资,将研究所得应用于可以让数十亿人受益的产品中。FAIR 是 Meta 取得成功的关键因素之一,也是世界上为数不多能够提供真正突破所需全部前提条件的团队之一:拥有业内最优秀的头脑、开放的文化氛围,以及最重要的是进行探索性研究的自由。正是这种自由让我们保持了敏捷性,为建设社交连接的未来做出了贡献。
未来
虽然在过去十年中,人工智能所取得的大部分进展是通过分而治之的方法实现的,将问题分解为独立的、明确定义的任务。但在未来十年,我们将越来越多地关注于将这些拼图拼凑在一起,以推进人工智能的发展。基础模型的兴起只是个开始:大型通用能力模型,我们可以灵活地根据特定需求和价值观对其进行调整。世界模型将变得越来越普遍,用于推理和规划,从而克服当前人工智能模型的局限性。未来不会出现单一的人工通用智能,而是各种不同的人工智能群体分布在不同平台上,这将彻底改变我们的工作、娱乐、交往、创作和生活方式。
走上这条道路需要我们对如何从头到尾负责任地构建人工智能模型有深刻的理解。我们将继续秉承安全和负责任的承诺来完成这项工作。开放科学是我们这一承诺的关键部分,也将继续成为 FAIR 的 DNA。无论是我们的论文、代码、模型、演示还是负责任使用指南,我们都旨在开放共享我们的工作,这有助于我们确立最高的质量和责任标准,这是帮助社区构建更好的人工智能解决方案的最佳途径。这也直接有助于 Meta 构建更安全、更健壮、更公平和更透明的人工智能解决方案,从而使我们的产品能惠及世界各地的不同用户。
展望 FAIR 未来的十年,我对我们解决人工智能最困难、最根本问题的愿景和雄心感到鼓舞。我感谢 Meta 内部为我们的成功做出贡献的众多团队和人员。我期待着如果我们继续朝着解决人工智能的目标前进,同时坚守我们对责任、卓越和开放的文化承诺,未来会怎样。
作者: Joelle Pineau,FAIR 副总裁。
