文档
备案
控制台
登录
立即注册
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
去发布
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
基于 Ray 的大模型离线推理
59819
148
更新时间:
点击下载
资源介绍
大模型离线推理,是指在具有数十亿或数万亿参数的大规模模型上进行分布式推理的过程。相较于常规模型推理,在模型切分、数据处理和数据流、提升 GPU 利用率方面面临了很大挑战。本次分享将介绍如何利用 Ray 及云原生优势助力大模型离线推理。
资源详情
主要内容:
大模型离线推理关键挑战
使用Ray构建推理框架的核心优势
Kuberay助力Ray云原生部署
听众收益:
了解大模型推理的挑战
了解Ray框架