OpenAI放大招：ChatGPT现在可以“说话”，收听和处理图像 - 文章 - 开发者社区

9月份，OpenAI动作不断，上周官宣DALL-E 3将集成到ChatGPT，昨天又宣布ChatGPT将上多模态。

ChatGPT现在可以“说话”，收听和处理图像。

这一信息标志着今年3月份发布GPT-4时展示的多模态落地了。

"我们开始在 ChatGPT 中推出新的语音和图像功能。它们提供了一种新的、更直观的界面类型，允许您进行语音对话或向 ChatGPT 展示您在说什么。

语音和图像为您提供了更多在生活中使用 ChatGPT 的方式。在旅行时拍摄地标的照片，并就其有趣的内容进行实时对话。当您在家时，拍摄冰箱和食品储藏室的照片，以确定晚餐的食物（并询问后续问题以获取分步食谱）。晚饭后，通过拍照、圈出问题集并让它与你们俩分享提示来帮助您的孩子解决数学问题。

我们将在未来两周内向Plus和Enterprise用户推出ChatGPT中的语音和图像。语音即将在iOS和Android上推出（在您的设置中选择加入），图像将在所有平台上提供。”

picture.image

对未来趋势的判断：

1、OpenAI在AIGC领域继续保持领头羊地位，多模态将成为LLM的标杆，其他公司会快速跟进；

2、多模态的交互性变多，可以拓展的应用领域也增多了，会有更多的产品加入LLM的技术支持；

3、多模态的引入，让LLM更趋于人格化，它能看、能说、能理解你的意图，那么加在现在的机器人身上，就是个具备智能的机器人了；

对打工人的影响？

1、基础工作岗位加速淘汰中；

2、新增AIGC岗位会增加；

3、LLM使得很多产品加速从知识客服-知识助理-知识管家的转变，这里类比贾维斯。当你说句话的时候，LLM已经帮你把事情做完了。

更多有关AIGC的学习资料，可以访问公众号【去玩AI】，加入学习者群，我们一起进步。

picture.image

如果觉得本文有价值，请点赞和分享吧↓↓↓