语音合成大模型,双向流式websocket-V3 交互图有误?

语音合成服务,测试下来发现,如果没有发送 finish session 消息的话,TTS server 不会发送 TTS_RESPONSE,这和文档上的流程不一致 https://www.volcengine.com/docs/6561/1329505#%E4%BA%A4%E4%BA%92%E7%A4%BA%E4%BE%8B

为什么一定要发送 finish session 之后才会收到音频数据呢?是因为大模型一定要一句完整的话,才好输出语音吗?

官方有没有飞书技术群?这样的问答效率非常低,不如阿里云的钉钉技术群,有什么问题基本上立刻都能解答。

72
0
0
暂时没有回答,开始写第一个回答
关于作者

文章

0

获赞

0

收藏

0