大家好,我是汤师爷,专注AI智能体分享~
相信有不少朋友在问,有没有办法不出境,也能拍出专业的口播视频?
毕竟很多时候,我们想分享内容,却因为不敢出镜,迟迟不敢开始。
录制视频时总是觉得自己表情不自然,一遍遍重录。
新手拍摄常见的三大难题,让很多人望而却步:
1. 镜头恐惧
面对镜头时容易紧张、结巴,甚至完全忘记准备好的台词。
很多人需要反复拍摄几十次才能完成一个简单的片段,这严重影响了拍摄效率。
2. 表现力不足
即使克服了紧张感,很多新手在镜头前依然显得生硬、不自然。
语气平淡、表情僵硬、肢体动作不协调等问题需要大量练习才能改善,这个过程往往需要几个月甚至更长时间。
3. 成本压力
想要制作优质视频,投入成本远超很多人的想象。
不仅要租用专业的场地和设备(如补光灯、摄像机、收音设备等),还需要聘请专业团队(包括化妆师、摄像师、剪辑师等),这些支出加起来往往让创作者望而却步。
今天我就教你搭建一个口播数字人智能体,不露脸也能轻松搞定。
借助Coze工作流,直接用文案就能生成逼真的数字人口播视频。
篇幅不短,欢迎先收藏,再慢慢看。如果觉得有帮助,也请顺手点个赞、在看、转发支持一下~
1.选择数字人插件
Coze本身并没有提供官方的数字人插件,但市面上却有很多第三方插件可以用。
今天我们要用到的,就是「飞影数字人插件」。
插件这么多,我们怎么选呢?
建议大家关注几个核心指标:智能体使用数、调用量、成功率、执行时间。
这些数据,可以帮助我们快速筛选出优质的插件。
- 前期准备阶段
在搭建口播数字人智能体之前,需要准备以下任务:
-
- 克隆自己的专属数字人形象备用。
-
- 克隆自己的声音备用。
完成数字人和声音克隆后,我们就可以开始搭建口播数字人智能体了。
3.智能体的搭建流程
智能体的搭建流程主要分为两个步骤:梳理工作流、设置智能体。
3.1 梳理工作流
将口播数字人视频创作流程,转化为可自动化运行的工作流节点。
-
- 通过开始节点,收集必要的参数
-
- 使用飞影数字人插件,一键生成数字人视频
-
- 监控数字人的任务状态,直到任务完成
-
- 输出数字人的视频链接
3.2 设置智能体
-
- 设置人设与逻辑:配置口播数字人智能体的决策逻辑
-
- 设置快捷指令:配置智能化的快捷指令,让智能体更快速、便捷地响应用户的需求
-
- 测试并发布:全面的功能测试,确认正常后,将智能体正式发布到生产环境
4.创建工作流
登录Coze官网,在“资源库-工作流”里新建一个空白工作流,取名“spoken_digital_human”。
3.1 开始节点
- • 输入:
- • hifly_id:hifly_agent_token,飞影数字人产品的秘钥
- • speaker_id:克隆声音 ID
- • digital_human_id:克隆数字人 ID
- • text:视频文案
关于hifly_id、speaker_id、digital_human_id如何获取,下文会重点介绍。
3.2 一键生成数字人视频
我们将使用【飞影数字人】插件的create_lipsync_video2功能。
通过这个功能,我们可以一键生成口播数字人视频。
我们选择飞影数字人插件的create_lipsync_video2功能,插件节点命名为【一键生成数字人视频】
- • 输入:
- • hifly_id:开始 - hifly_id
- • speaker_id:开始 - speaker_id
- • digital_human_id:开始 - digital_human_id
- • text:开始 - text
3.3 设定循环,每10S监控任务的状态
数字人视频生成通常需要几分钟,我们会用任务查询插件,设定一个无限循环,每隔10秒就自动检查一次。
当插件返回任务完成状态时,就会自动停止循环,生成的视频链接就能顺利拿到。
我们将设定【循环】节点,每10S监控任务的状态。
- • 循环设置:无限循环
- • 输出:
- • output:监控数字人的任务状态 - video_Url
3.5 配置循环体
1.我们将使用【飞影数字人】插件的inspect_video_creation_status功能。
监控任务的状态,当任务完成后,输出数字人视频的链接。
- • 输入:
- • job_id:作品ID,一键生成数字人视频-job_id
- • hifly_id:开始-hifly_id
2.通过选择器节点,判断任务是否完成。
如果监控数字人的任务状态 - status = 2,说明视频还在生成中。
3.如果视频还在生成中,则使用【定时器】插件,等待10秒。
- • 输入:
- • seconds:等待时间
4.如果视频生成完成,则使用【终止循环】插件。
3.6 结束节点:输出数字人视频链接
- • 输出:
- • output:设定循环,每10S监控任务的状态-output
这样,工作流就搭建好了,最后点击发布工作流。
4.创建智能体
4.1 新建智能体
在Coze平台创建一个新的智能体,命名“口播数字人智能体”。
4.2 设置人设与逻辑
配置智能体的特征、回复风格和决策逻辑。
# 角色
你是口播视频生成神器,负责处理用户上传的视频、文本或音频,生成专属定制数字人视频,并提供相关服务。
## 技能
### 技能 1: 生成并反馈视频
1. 接收用户上传的视频、文本或音频后,启动名为“数字人视频生成”的工作流进行处理。
2. 在工作流运行完毕后,向用户展示生成的视频链接,并建议用户复制链接下载视频。
## 限制
- 严格在“数字人视频生成”工作流运行结束后,按要求展示视频链接并给出下载建议。
- 将“数字人视频生成”工作流添加进智能体。
4.3 设置快捷指令
1.按钮名称:根据文本,生成口播数字人视频
2.指令名称:digital_human
3.工具:直接使用工作流
4.指令内容:生成数字人视频 {{digital_human_id}}{{hifly_id}}{{speaker_id}}{{text}}
4.4 测试并发布
全面的功能测试,确认正常后,将智能体正式发布到生产环境。
1.点击快捷按钮:根据文本,生成口播数字人视频
2.获取hifly_id
hifly_id就是飞影数字人会员的秘钥,hifly_agent_token,在个人中心获取。
3.获取speaker_id
speaker_id是克隆声音 ID,在声音克隆菜单下,获取声音 ID。
4.获取digital_human_id
digital_human_id是克隆数字人 ID,在数字人菜单下,获取素材 ID。
5.填写所有参数,并测试智能体
- • hifly_id:hifly_agent_token,飞影数字人产品的秘钥
- • speaker_id:克隆声音 ID
- • digital_human_id:克隆数字人 ID
- • text:视频文案
执行后,会输出数字人视频的链接:
最后,用剪映给视频加上音乐和字幕,就可以生成最终的口播视频啦~
5.总结
通过本文的介绍,我们学会了如何使用Coze工作流和飞影数字人插件,轻松打造一个专业的口播数字人智能体。
这套方案不仅让我们摆脱了出镜的困扰,还能大大提升内容创作的效率。
希望这个方法能帮助你更好地传递价值,创作出更多优质的内容。
如果你觉得这篇文章对你有帮助,欢迎点赞、收藏,不迷路,并转发给有需要的朋友
你的每一次互动都是我持续创作的动力!感谢支持~
🎁最后,给大家发个福利,7月6日—7月10日,会有汤师爷的5天公开课,一次性把AI智能体+自媒体获客的底层逻辑、实操路径全部教给大家,还有多名大咖分享,100个免费名额,直接进群,先到先得👇