话不多说,先看效果。
这是案例视频
如下图是生成的文案。
运行结果显示,工作流使用了27s,0tokens,也就是没有消耗任何资源点!而且我粗略估计,文本识别准确率高达95%。
下面我讲下怎么实现的。
思路:
一般遇到这种需求,我们都是直接去找视频转文案插件,但是这种插件都需要输入api-key,也就是多半需要付费获取。
换个思路,既然视频转文案需要付费,那我先把视频转音频,音频转文案不就可以了,于是我尝试着去做了,发现真的能成功,而且不需要花费任何资源点!
把思路理清楚之后,我们就顺着思路去找视频转音频插件。
找下来发现真有好用而且免费的视频转音频插件。
解决了视频转音频,我们就要处理一下音频转文案了。
如果这个时候直接搜音频转文案,其实大多数还是需要api-key。
再换个思路,音频转文案可不就是语音识别。
是的,而且还是coze官方出的。这里有个小技巧,搜的时候最好选择仅展示官方插件,因为官方的稳定还免费。
整体工作流还是比较简单的,整体工作流如下图所示。
好了,今天就分享到这里了。
评论区回复“视频转文案”,加我微信打包发给你!
