基于 Ray 的大模型离线推理
30248
120
更新时间:

资源介绍

大模型离线推理,是指在具有数十亿或数万亿参数的大规模模型上进行分布式推理的过程。相较于常规模型推理,在模型切分、数据处理和数据流、提升 GPU 利用率方面面临了很大挑战。本次分享将介绍如何利用 Ray 及云原生优势助力大模型离线推理。

资源详情

主要内容:

  1. 大模型离线推理关键挑战
  2. 使用Ray构建推理框架的核心优势
  3. Kuberay助力Ray云原生部署

听众收益:

  1. 了解大模型推理的挑战
  2. 了解Ray框架