私有部署 ChatGLM3-6B

GPU容器数据库
  1. 在 AutoDL 平台上租赁 GPU =====================

picture.image

  • GPU 型号:RTX 4090
  • PyTorch 版本:2.5.1**(推荐使用 2.0 及以上的版本,以获得最佳的推理性能)**
  1. 开启学术资源加速 ===========

picture.image

source /etc/network_turbo

  1. 拉取模型代码 =========

git clone https://github.com/THUDM/ChatGLM3

  1. 安装依赖 =======

cd ChatGLM3

pip install -r requirements.txt

特别提示:如果不需要运行可视化 demo,则可以将 gradio 依赖删除,这样可以避免一些依赖版本冲突问题,也可以节省资源。

basic requirementstransformers==4.40.0cpm_kernels>=1.0.11torch>=2.3.0vllm>=0.4.2gradio>=4.26.0sentencepiece>=0.2.0sentence_transformers>=2.7.0accelerate>=0.29.2streamlit>=1.33.0fastapi>=0.110.0loguru~=0.7.2mdtex2html>=1.3.0latex2mathml>=3.77.0jupyter_client>=8.6.1# for openai demoopenai>=1.30.1pydantic>=2.7.1sse-starlette>=2.1.0uvicorn>=0.29.0timm>=0.9.16tiktoken>=0.6.0# for langchain demolangchain>=0.2.1langchain_community>=0.2.0langchainhub>=0.1.15arxiv>=2.1.0
  1. 运行 Demo ==========

cd basic_demo/

python cli_demo.py

特别提示:初次运行时,需要执行资源初始化的操作,耗时可能较长,需要耐心等待。
  1. 效果展示 =======

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论