慢慢学 AIGC 的个人主页 - 开发者社区

文档备案控制台登录立即注册

首页文章活动开发者计划镜像站

发布

慢慢学 AIGC

文章

专栏

问答

慢慢学 AIGC

Llama 4 系列：开启原生多模态 AI 创新的新纪元

AI大模型向量数据库机器学习

LLaMA 也开始拥抱 MoE 架构了，速来体验

140

慢慢学 AIGC

DeepSeek 开源周（三）：DeepGEMM 性能实测及 NV 往事

开源向量数据库大模型机器学习

DeepGEMM 和曾经的屠龙少年一些往事

462

慢慢学 AIGC

DeepSeek 开源周（二）：DeepSeek MoE 架构回顾和 DeepEP 性能实测

开源大模型向量数据库机器学习

DeepSeek MoE 架构演进和工程优化经验

979

慢慢学 AIGC

DeepSeek 开源周（一）：FlashMLA 在 H100 上的性能实测

开源大模型向量数据库机器学习

可能是全网第一个 FlashMLA 性能实测

304

慢慢学 AIGC

KTransformer：把 DeepSeek R1 推理机器成本打下来

AI大模型向量数据库机器学习

点击下方卡片，关注“慢慢学AIGC”前言前面几篇 DeepSeek R1 本地部署和测评文章：《DeepSeek 本地部署最佳实践（一）：Ollama+Open WebUI + 蒸馏版》《DeepSeek 本地部署最佳实践（二）：llama.cpp + Open WebUI 部署 unsloth 量化版模型》《DeepSeek 本地部署最佳实践（三）：SGLang + 分布式推理部署满血版模型》《

701

慢慢学 AIGC

DeepSeek 本地部署最佳实践（一）：Ollama+Open WebUI + 蒸馏版

AI大模型向量数据库云安全

本文为 DeepSeek 本地部署最佳实践系列文章的第一篇，主要介绍 DeepSeek 蒸馏版模型本地部署方法，基于 Ollama + Open WebUI 实现了类似 ChatGPT 的体验，支持联网搜索。

1190

慢慢学 AIGC

DeepSeek 本地部署最佳实践（二）：llama.cpp + Open WebUI 部署 unsloth 量化版模型

大模型大模型向量数据库机器学习

本文是 DeepSeek 本地部署最佳实践系列文章的第二篇，在前文基础上继续介绍如何在显存受限的 GPU 环境运行 Unsloth 量化版 DeepSeek R1 模型。

1768

慢慢学 AIGC

DeepSeek 本地部署最佳实践（三）：SGLang + 分布式推理部署满血版模型

大模型向量数据库大模型容器

本文为 DeepSeek 本地部署最佳实践系列文章的完结篇，只关注 R1 671B 满血版模型部署，建议有条件的读者阅读。

6388

慢慢学 AIGC

DeepSeek 本地部署——蒸馏版、量化版和满血版实测效果对比

云原生大模型向量数据库机器学习

本文将介绍本地部署 DeepSeek 的三种不同类型模型：满血版，1.58 bit 量化版和蒸馏版（Qwen 1.5B），使用同一代码生成问题进行效果评测，最后给出实际部署建议。

5042

慢慢学 AIGC

DeepSeek R1: 理解 GRPO 和多阶段训练

AI大模型向量数据库机器学习

点击下方卡片，关注“ 慢慢学AIGC ”前言人工智能随着 DeepSeek R1 的发布迈出了重要的一步，这是一款开源模型，在高级推理任务上对 OpenAI 的 o1 发起了挑战。 DeepSeek R1 采用了一种创新技术——群体相对策略优化（Group Relative Policy Optimisation，GRPO），并结合多阶段训练方法，在数学、编程和通用推理等领域树立了新的基准

1234

慢慢学 AIGC

理解推理 LLM：构建和改进推理模型的方法与策略

AI大模型向量数据库机器学习

介绍了 DeepSeek R1 推理模型构建过程和一些相关工作

317

慢慢学 AIGC

【DeepSeek AI】Janus-Pro: 数据与模型扩展的统一多模态理解与生成

AI大模型向量数据库机器学习

点击下方卡片，关注“ 慢慢学AIGC ”内容来源：DeepSeek 论文作者：DeepSeek-AI项目页面 : https://github.com/deepseek-ai/Janus摘要在本研究中，我们提出了 Janus-Pro ，这是之前工作 Janus 的高级版本。具体而言，Janus-Pro 引入了以下改进：优化的训练策略；扩展的训练数据；更大模型规模的扩展。通过这些改进，

463

慢慢学 AIGC

深度求索：探寻风暴之眼

AI大模型向量数据库机器学习

AI 成本控制领域的领导地位、真实的训练成本、闭源模型利润率如何影响英伟达 H100 定价飙升、补贴推理定价策略、出口管制政策与 MLA 解析

277

慢慢学 AIGC

DeepSeek-R1：通过强化学习激励大语言模型的推理能力

AI大模型向量数据库云通信

点击下方卡片，关注“ 慢慢学AIGC ”内容来源： DeepSeek R1 论文摘要我们介绍了我们第一代推理模型：DeepSeek-R1-Zero 和 DeepSeek-R1。DeepSeek-R1-Zero 是一个通过大规模强化学习(RL)训练的模型，在没有监督微调(SFT)作为初步步骤的情况下，展现出了显著的推理能力。通过强化学习，DeepSeek-R1-Zero 自然地形成了许多强大而有