不会搭coze工作流?保姆级教程带你搭建一个古诗词字幕+音频工作流!

向量数据库大模型NoSQL数据库

大家好,我是灿灿,专注于AI智能体应用,最近打算出一个coze基本教程系列,也希望能链接到同频的小伙伴。

这系列教程可以逐步让你熟悉完整视频工作流搭建思路,到时候可以自己试着动手搭建工作流。

上一篇文章我们讲了古诗词字幕工作流,今天要讲 古诗词字幕 + 音频工作流。

没看过上一篇的小伙伴可以点击下面链接查看。

不会搭coze工作流?保姆级教程带你搭建一个古诗词字幕工作流!

话不多说,先看视频效果。

思路分析:

前一篇文章我们讲了字幕的时间线是自定义的,设置好时间总长度和视频段数即可。但是现在加上了音频,如果输入的文案生成的音频时长超过了自定义的视频时长就会出现缺失音频的问题,换个思路,我们直接使用音频数据作为时间线,音频出来的同时其实字幕也是能出来的,话都讲完了字幕肯定能显示出来,这个时候把字幕数据的时间线设置为音频的时间线就行。

思路理清楚了,再来看音频怎么生成,上一篇文章我们讲过了古诗词文案分了四段,所以我们可以根据这个文案数组批量生成音频数据。

这里涉及两个新的节点,一个是批处理节点,一个是音频合成节点。

我们以上一个工作流为基础,添加新节点进来。

  1. 在文本处理节点后面添加批处理节点合成音频数据。

批处理节点接收文本处理节点输出的字符串数组,然后把数组里的元素传给语音合成节点,再输出音频数据列表。

picture.image

  1. 把自定义时间线节点改成音频节点

输入批处理输出的数据即可生成音频时间线。

picture.image

  1. 把音频时间线加入字幕信息节点和音频时间节点

picture.image

picture.image

  1. 在添加字幕数据节点后面添加音频数据节点

输入的音频数据就是上面的音频节点输出信息了。

picture.image

好啦, 完整的教程就到这里啦,想要工作流完整源码的小伙伴可以加我获取。

picture.image

码字不易,有收获的小伙伴点个一键三连哦~

picture.image关注我,后续我会分享更多智能体相关干货

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大规模高性能计算集群优化实践
随着机器学习的发展,数据量和训练模型都有越来越大的趋势,这对基础设施有了更高的要求,包括硬件、网络架构等。本次分享主要介绍火山引擎支撑大规模高性能计算集群的架构和优化实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论