OpenAI放大招:ChatGPT现在可以“说话”,收听和处理图像

大模型向量数据库机器学习

9月份,OpenAI动作不断,上周官宣DALL-E 3将集成到ChatGPT,昨天又宣布ChatGPT将上多模态。

OpenAI宣布推出具有ChatGPT集成的DALL-E 3

ChatGPT现在可以“说话”,收听和处理图像。

这一信息标志着今年3月份发布GPT-4时展示的多模态落地了。

"我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面类型,允许您进行语音对话或向 ChatGPT 展示您在说什么。

语音和图像为您提供了更多在生活中使用 ChatGPT 的方式。在旅行时拍摄地标的照片,并就其有趣的内容进行实时对话。当您在家时,拍摄冰箱和食品储藏室的照片,以确定晚餐的食物(并询问后续问题以获取分步食谱)。晚饭后,通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题。

我们将在未来两周内向Plus和Enterprise用户推出ChatGPT中的语音和图像。语音即将在iOS和Android上推出(在您的设置中选择加入),图像将在所有平台上提供。

picture.image


对未来趋势的判断:

1、OpenAI在AIGC领域继续保持领头羊地位,多模态将成为LLM的标杆,其他公司会快速跟进;

2、多模态的交互性变多,可以拓展的应用领域也增多了,会有更多的产品加入LLM的技术支持;

3、多模态的引入,让LLM更趋于人格化,它能看、能说、能理解你的意图,那么加在现在的机器人身上,就是个具备智能的机器人了;


对打工人的影响?

1、基础工作岗位加速淘汰中;

2、新增AIGC岗位会增加;

3、LLM使得很多产品加速从知识客服-知识助理-知识管家的转变,这里类比贾维斯。当你说句话的时候,LLM已经帮你把事情做完了。

更多有关AIGC的学习资料,可以访问公众号【去玩AI】,加入学习者群,我们一起进步。

picture.image

如果觉得本文有价值,请点赞和分享吧↓↓↓

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论