点击上方👆蓝字关注我们!
随着大模型推理在实际业务中应用场景越来越广泛,使用大模型进行推理过程中暴露出的问题也越来越多。推理延迟破 10 秒、显存溢出频繁报错、分布式缓存命中率低 —— 这些大模型落地的 “老大难”问题,终于有了交流平台。火山引擎联合 SGLang、NVIDIA 重磅打造「大模型推理性能优化研讨会」。
11 月 7 日,一定不要错过这场干活盛宴!火山引擎联合开发者社区、SGLang 社区、NVIDIA 举办一场技术交流专场!我们邀请到了行业内的多位技术资深专家,围绕大模型推理过程的稳定性、推理性能优化路径、部署工具等分享最新的落地实践和优化经验,分享不同视角下的大模型优化方法,详细解读大模型推理落地过程中遇到的挑战、解决方案和心得,并解读未来大模型推理的发展方向,帮助开发者更好的解决大模型推理过程中的挑战,提供开发者的交流平台!
⏰时间:2025/11/7(周五)14:00-18:00
⚡️地点:上海新江湾广场 T2 A 号楼
点击【阅读原文】立即报名
