完全离线、免费训练！手把手教你打造专属数字人 - 文章 - 开发者社区

过去一年，很多人已经用数字人 批量生产内容、做教学、做直播、打造个人 IP ，悄悄把产能提升了 5 倍以上。

但真正能让普通人用起来的数字人方案，其实非常少 ——
不是 需要联网、担心隐私泄露 ，
就是 需要订阅、成本高得离谱 ，

所以当我看到这个项目时，我的第一反应是：

这才是数字人真正开始落地的那一刻。

它 免费、可本地部署 ，不需要联网、不依赖云端、不担心隐私，不花钱也能搭建属于自己的数字分身。

一句话：
你终于可以拥有一个为你出镜工作的数字分身了。

picture.image

它能够帮你制作视频、合成声音，甚至成为你的虚拟代言人，在个人电脑上即可定制专属的数字分身。

HeyGem是什么？

HeyGem 是由Duix.com开发的免费开源AI数字人项目，与许多只能在线使用的网页数字人平台不同，它的最大特点是 支持完全离线运行 ，不需要联网也能正常使用。

picture.image

这意味着所有数据都能安全保存在本地， 隐私得到充分保护 ，内容完全可控。

对于那些担心数据外泄，或者想打造本地AI工作流的朋友来说，这无疑是理想选择。

与商业数字人平台相比，HeyGem具有三大核心优势：

完全免费开源 ：无需支付高昂的订阅费用
本地化部署 ：所有数据处理在本地完成，杜绝隐私泄露风险
高度可定制 ：可以根据需要调整数字人的各项参数

picture.image

硬件要求：你的电脑能运行HeyGem吗？

在开始之前，需要先确认你的电脑是否满足运行HeyGem的基本要求。

picture.image

以下是官方推荐的硬件配置：

系统要求 ：

∙操作系统：Windows 10 19042.1526或更高版本

硬件推荐配置 ：
∙CPU：第13代英特尔酷睿 i5-13400F或更高
∙内存：32GB（最低16GB可勉强运行）
∙显卡：NVIDIA RTX-4070或同等性能显卡（显存至少8GB，推荐12GB）
∙磁盘空间：D盘至少30GB空间（存储数字人数据），其他磁盘建议100GB以上空间

实测表明，在RTX 4060Ti 8GB显卡上，生成视频的时长与实际耗时比大约为1：4到1：8，即生成1分钟的数字人视频可能需要4-8分钟。

HeyGem安装与部署详细教程

3.1 安装前准备

第一步：安装显卡驱动

HeyGem目前仅支持NVIDIA显卡。

请前往英伟达官网，选择你的显卡型号，下载并安装最新版驱动。

picture.image

第二步：安装Docker Desktop

Docker是运行HeyGem后端服务的必要环境。

前往Docker官网下载Docker Desktop安装包，按提示完成安装。

重要提示 ：安装完成后，建议在Docker设置中修改镜像文件的存储路径，避免C盘空间被占满。

具体操作：打开Docker设置 → 选择“Resources” → 修改“Disk image location”为空间充足的磁盘。

picture.image

3.2 部署HeyGem服务端

获取HeyGem资源包

访问HeyGem的GitHub项目地址，下载资源压缩包并解压。

启动服务 进

入解压后的“deploy”目录，在此处打开命令窗口（Shift+右键选择“在此处打开命令窗口”），输入以下命令：

  
docker-compose up -d

此过程会自动下载约70GB的服务镜像文件，需要较长时间和稳定的网络环境。

验证服务 打开Docker Desktop，在容器列表中看到三个名字类似tts、asr、f2f的服务在运行，即表示部署成功。

3.3 安装HeyGem客户端

从GitHub项目页面的Releases中下载最新的客户端安装包，双击运行并按提示完成安装。

picture.image

四、制作你的第一个数字分身

4.1 录制模特视频

打开HeyGem客户端，点击“快速定制”按钮，录制一段 至少8秒 的清晰人脸视频。要求面部光线充足，表情自然，确保视频质量以达到最佳效果。

picture.image

4.2 生成数字人模型

上传视频后，系统会自动提取面部特征，训练数字人模型。此过程会占用较多GPU资源，需要耐心等待。

picture.image

4.3 制作数字人视频

模型训练完成后，即可开始制作数字人视频：

选择已训练好的数字人模型
输入要合成的文本或上传音频文件
调整参数（可选）
点击“生成视频”

picture.image

HeyGem的核心技术封装在三个后端服务中：TTS（文本转语音）、ASR（自动语音识别）和F2F（面部生成），其中F2F服务是最核心的部分。

五、实用技巧与优化建议

5.1 提高数字人质量的方法

视频素材质量 ：使用高清摄像头，保证光线均匀柔和
表情自然 ：录制时保持自然表情和适度肢体语言
音频清晰 ：如使用自定义音频，确保录音质量高
文本长度 ：单次生成视频不宜过长，建议分段处理

5.2 常见问题解决

生成失败 ：检查显卡显存是否充足，尝试缩短视频长度或降低分辨率
运行缓慢 ：关闭其他占用GPU的程序，确保系统资源充足
无法启动 ：确认Docker服务正常运行，所有容器已启动

六、数字分身的应用场景

你的数字分身可以应用于多种场景：

视频内容创作 ：批量制作短视频内容，提高产出效率
在线教育 ：创建虚拟教师形象，进行课程讲解
企业宣传 ：打造企业专属虚拟形象代言人
个人IP打造 ：建立独特的个人品牌形象

结语

我们可以在个人电脑上轻松打造专属数字分身，这标志着AI技术正变得越来越 民主化 和 可及化 。无论你是内容创作者、教育工作者还是企业主，都能从中受益。

现在就开始行动吧，打造属于你自己的数字分身，探索AI世界的无限可能！

📢 加入实战派AI共创社群！

我们的AI社群聚集了一线AI高手，专注于扣子、Dify、n8n 等主流智能体平台的实战落地。

如果你有定制智能体、RAG知识库构建、企业项目实施，BC端培训需求，这里都有成熟经验与落地案例等你对接。

picture.image

智能体时代，如何写好提示词？一份高级提示词工程指南

GEO优化实战：如何让DeepSeek推荐你的品牌

免费开源！3步搞定小红书自动发布，效率提升100%

95%的智能体都会失败？硅谷一线创业者内部分享