模型回复速度慢

Coze
偶尔变慢的原因

模型服务接入方舟公共资源池,会随着整体的服务情况产生波动。

解决方案
  • 切换轻量化的lite系列模型 picture.image

  • 在人设与回复逻辑中约束模型生成的字数也可以让大模型更快的完成输出。

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎 EMR 基于 Proton 的存算分离实践
EMR 团队针对这些挑战自研了 Proton 加速引擎,深度优化对象存储读写能力,与 Hive/Spark/Trino 等计算引擎集成后,在不改变用户使用习惯的前提条件下,可提供对象存储数据集的透明加速服务。在离线场景下,其性能基本持平存算一体架构。本次分享将介绍 Proton 技术能力和最佳实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论