科幻照进现实,云端情人上线,OpenAI发布GPT-4o

大模型向量数据库云安全

Sam Altman发推,引用了电影《Her》:也许我们正在经历一个与电影中类似的阶段,即人类与智能系统之间的交互越来越深入,情感联系也日益紧密。

科幻电影照进现实

picture.image

电影Her 又被译作 触不到的她,是2013年上映的一部美国科幻爱情剧情片,电影讲述男子与女声人工智能虚拟助手之间所发展的恋情,电影获得第86届奥斯卡金像奖最佳影片(提名)。

为AI助手配音的寡姐则凭借此片,获得罗马电影节最佳女演员。

picture.image

这部电影在中国上海拍摄,而且其中有很多华人面孔和中文标志,据说导演借此隐喻未来的世界将被中国文化渗透至极。

picture.image

十年之前,科幻电影中的机器人和智能系统还仅仅是银幕上的幻影,随着科技的飞速发展,人工智能已经不再是简单的自动化工具,而是拥有深度学习和自我进化能力的智能生命体。

如今,智能助手已经能够读懂我们的情绪,预测我们的需求,甚至在我们尚未意识到之前,就为我们规划好了生活的各个方面。

言归正传,整体来看,发布会主要分为两大部分:推出新旗舰模型“GPT-4o”,以及在ChatGPT中免费提供更多功能。

更强大的GPT-4o

OpenAI在活动中发布了新旗舰模型“GPT-4o”,“可以实时对音频、视觉和文本进行推理。”据介绍,新模型使ChatGPT能够处理50种不同的语言,同时提高了速度和质量。

GPT-4o的“o”代表“omni”。该词意为“全能”,源自拉丁语“omnis”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。

picture.image

新闻稿称,GPT-4o是迈向更自然人机交互的一步,它可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出,“与现有模型相比,GPT-4o在图像和音频理解方面尤其出色。”

在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒,GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,让GPT-4无法直接观察音调、说话的人和背景噪音,也无法输出笑声、歌唱声和表达情感。

所有用户皆可免费使用

发布会结束,OpenAI表示今天的发布会主要聚焦于免费用户,这些功能将在未来几周内逐步向所有用户推送。

根据OpenAI的官网公告显示,GPT-4o将同时向付费的Plus、Team用户,以及免费用户推出。Plus 用户的消息限制数量将是免费用户的5倍,Team和Enterprise用户的可用消息数量还会更高一些。

当免费用户的使用量达到限制后,ChatGPT将自动切换到GPT-3.5,以便继续进行对话。

发布会重点回顾

01点00分:倒计时结束,直播正式开始。首席技术官Mira Murati登场。

picture.image

01点01分:Mira Murati表示,今天她将谈论3件事情:1)为什么一个可以免费、广泛使用的工具对于OpenAI非常重要?2)如何减少摩擦,让每个人都能使用ChatGPT,公司将发布桌面版的ChatGPT;3)公司将在今日发布最新的旗舰大模型,叫做GPT-4o。

picture.image

01点05分:对于桌面版的ChatGPT,OpenAI表示重新对UI进行了设计。

picture.image

01点08分:GPT-4o具备GPT-4同等的智能,但运行速度更快,兼具文字、音频和视频能力。这是OpenAI历史上第一次在“便于使用”这个目标上实现了飞跃的进步。

01点13分:直到今天之前,在语音模式下,OpenAI仍需要调用三个模型——转写、智能和文生语音功能,这也造成了体验上的巨大延迟。而GPT-4o可以自然地在图片、文件和声音上进行推理。

01点20分:目前GPT Store里已经有超过100万个GPTs。伴随着免费开放,GPTs的开发者将获得更大的用户基数。

picture.image

01点22分:免费用户也将能够上传图片、进行分析、使用“浏览器”功能搜索实时信息。同时GPT-4o也将支持记忆功能。GPT-4o也将支持API,供开发者调用。相较于GPT-4 Turbo,GPT-4o快两倍、便宜50%,速率限制高出5倍。

picture.image

01点25分:两名研究主管Mark Chen和Barret Zoph登台,他们将演示一系列新功能。

picture.image

01点26分:Mark Chen正在与ChatGPT寒暄,机器人能够从急促的喘气声中理解“紧张”的含义,并且指导他进行深呼吸。

picture.image

01点28分:Chen表示,他的演示是为了说明,在目前的语音模式下,不需要再与机器进行机械的一问一答,可以进行实时的沟通交流。实时交流中不需要再每次“尴尬地等待2-3秒”。

picture.image

01点35分:Barret Zoph启动摄像头,要求ChatGPT实时帮助他解决一个一元方程题。

picture.image

01点37分:除了图像识别和解题能力外,ChatGPT展现了实时根据影像变化,与Barret实时互动的能力。

picture.image

01点40分:Barret进一步展示了ChatGPT桌面版对代码和电脑桌面(一张气温图表)进行实时解读的能力。

picture.image

picture.image

01点42分:Murati和Mark Chen展示ChatGPT进行意大利语、英语的实时交传翻译。

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论