活动邀请｜火山引擎大模型推理性能优化研讨会

大模型开发与运维AI开放平台

点击上方👆蓝字关注我们！

picture.image

随着大模型推理在实际业务中应用场景越来越广泛，使用大模型进行推理过程中暴露出的问题也越来越多。推理延迟破 10 秒、显存溢出频繁报错、分布式缓存命中率低 —— 这些大模型落地的 “老大难”问题，终于有了交流平台。火山引擎联合 SGLang、NVIDIA 重磅打造「大模型推理性能优化研讨会」。

11 月 7 日，一定不要错过这场干活盛宴！火山引擎联合开发者社区、SGLang 社区、NVIDIA 举办一场技术交流专场！我们邀请到了行业内的多位技术资深专家，围绕大模型推理过程的稳定性、推理性能优化路径、部署工具等分享最新的落地实践和优化经验，分享不同视角下的大模型优化方法，详细解读大模型推理落地过程中遇到的挑战、解决方案和心得，并解读未来大模型推理的发展方向，帮助开发者更好的解决大模型推理过程中的挑战，提供开发者的交流平台！

⏰时间：2025/11/7（周五）14:00-18:00
⚡️地点：上海新江湾广场 T2 A 号楼

picture.image

点击【阅读原文】立即报名