9月份,OpenAI动作不断,上周官宣DALL-E 3将集成到ChatGPT,昨天又宣布ChatGPT将上多模态。
OpenAI宣布推出具有ChatGPT集成的DALL-E 3
ChatGPT现在可以“说话”,收听和处理图像。
这一信息标志着今年3月份发布GPT-4时展示的多模态落地了。
"我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面类型,允许您进行语音对话或向 ChatGPT 展示您在说什么。
语音和图像为您提供了更多在生活中使用 ChatGPT 的方式。在旅行时拍摄地标的照片,并就其有趣的内容进行实时对话。当您在家时,拍摄冰箱和食品储藏室的照片,以确定晚餐的食物(并询问后续问题以获取分步食谱)。晚饭后,通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题。
我们将在未来两周内向Plus和Enterprise用户推出ChatGPT中的语音和图像。语音即将在iOS和Android上推出(在您的设置中选择加入),图像将在所有平台上提供。”
对未来趋势的判断:
1、OpenAI在AIGC领域继续保持领头羊地位,多模态将成为LLM的标杆,其他公司会快速跟进;
2、多模态的交互性变多,可以拓展的应用领域也增多了,会有更多的产品加入LLM的技术支持;
3、多模态的引入,让LLM更趋于人格化,它能看、能说、能理解你的意图,那么加在现在的机器人身上,就是个具备智能的机器人了;
对打工人的影响?
1、基础工作岗位加速淘汰中;
2、新增AIGC岗位会增加;
3、LLM使得很多产品加速从知识客服-知识助理-知识管家的转变,这里类比贾维斯。当你说句话的时候,LLM已经帮你把事情做完了。
更多有关AIGC的学习资料,可以访问公众号【去玩AI】,加入学习者群,我们一起进步。
如果觉得本文有价值,请点赞和分享吧↓↓↓