We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
基于 Ray 的大模型离线推理
30248
120
更新时间:
点击下载
资源介绍
大模型离线推理,是指在具有数十亿或数万亿参数的大规模模型上进行分布式推理的过程。相较于常规模型推理,在模型切分、数据处理和数据流、提升 GPU 利用率方面面临了很大挑战。本次分享将介绍如何利用 Ray 及云原生优势助力大模型离线推理。
资源详情
主要内容:
大模型离线推理关键挑战
使用Ray构建推理框架的核心优势
Kuberay助力Ray云原生部署
听众收益:
了解大模型推理的挑战
了解Ray框架