文档备案控制台登录立即注册
首页
AI 大模型体验中心AI 大模型体验中心AI 大模型体验中心
动手实验室动手实验室动手实验室
Agent 评测集Agent 评测集Agent 评测集
AI 案例广场AI 案例广场AI 案例广场
火山杯大赛学习中心
社区
去发布
首页
AI 大模型体验中心AI 大模型体验中心AI 大模型体验中心
动手实验室动手实验室动手实验室
Agent 评测集Agent 评测集Agent 评测集
AI 案例广场AI 案例广场AI 案例广场
学习中心
社区
架构师李哲
架构师李哲
文章
专栏
问答
架构师李哲
架构师李哲
从菜鸟到高手:LlamaFactory官方超参数终极指南(建议收藏)
AI人工智能
大模型微调是让通用模型走向垂直领域的必经之路。然而,面对 LlamaFactory 面板上密密麻麻的超参数,很多开发者常感到"无从下手":为什么 Loss 不下降?为什么模型学成了"复读机"?今天,LlamaFactory Online 官方团队特别邀请到了我们的算法专家为大家带来一期大模型微调超参数的深度解析。  【【LlamaFactory Online】大模型微调超参数全解析:从入门到上手,
45
0
0
0
架构师李哲
架构师李哲
别再死磕SFT了!用KTO微调Qwen3-14B,数据减半效果翻倍
AI人工智能
如果你已经用LlamaFactory Online微调过模型,大概率接触过SFT(监督微调) 和RLHF(基于人类反馈的强化学习)。前者需要精心构造“问题-答案”对,后者则需要收集大量的偏好对比数据——标注员要反复比较两个回答哪个更好,成本高、流程繁琐。 那么,有没有一种方法,既能利用偏好数据,又不需要成对比较? KTO(Kahneman-Tversky Optimization) 就是答案。它受
33
0
0
0
架构师李哲
架构师李哲
中国AI音乐,全球登顶!Mureka V8击败Suno、Udio,拿下权威榜单双料冠军
AI人工智能
AI音乐的“王者宝座”,第一次属于中国 先戴上耳机。听听下面这首歌。Mureka你能分辨出来,这是AI生成的,还是真人演唱的吗?答案是:全部由AI生成。那些听起来与真人演唱无异、连气息和换气声都拿捏得恰到好处的歌曲,出自中国AI音乐大模型——Mureka V8之手。就在刚刚过去的几天里,中国AI在世界舞台上投下了一枚重磅炸弹。  Artificial Analysis——被誉为“AI领域的Gar
61
0
0
0
架构师李哲
架构师李哲
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账
AI人工智能
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账 一个名字的变化,正在撬动一套全新的万亿级商业规则。 Token—这个曾只在技术圈流传的词汇,如今频繁进入大众视野:以它计费的AI应用火热出圈,云厂商更新计费体系,海外热议“中国Token”。 在喧嚣中,2026年3月23日,国家数据局局长刘烈宏在中国发展高层论坛2026年年会上明确:Token的中文正式定为“词元”。 他将其定义为智能
62
0
0
0
架构师李哲
架构师李哲
英伟达用AI智能体7天自主优化GPU内核,超越人类专家
AI人工智能
人类认知能力,已成为软件工程的瓶颈 这应该是2026年3月最炸裂的科技新闻。在很多算子开发者的微信群里,已经掀起了轩然大波。“这或许是超人类智能在软件领域的真正首次展露。”英伟达研究员许冰刚刚在X上发出了如此断言。他所评论的,正是他与Terry Chen和Zhifan Ye为共同一作的一项英伟达新研究——AVO。在这项刚刚提交到arXiv上的研究中,英伟达构建了Agentic Variation
182
0
0
0
架构师李哲
架构师李哲
阿里云突然宣布:最高涨34%!告别“价格战”,AI算力正式进入稀缺时代
AI大模型
当云计算行业持续十几年的低价内卷成为过去式,一场由AI需求引爆的算力涨价潮,正彻底改写行业规则。 2026年3月18日午间,阿里云官网正式发布调价公告,瞬间在云计算、AI产业圈引发轩然大波。受全球AI算力需求爆发式增长、核心硬件供应链成本持续攀升等多重因素影响,阿里云将对AI算力、高性能存储等核心产品上调价格,其中部分AI算力产品最高涨幅达到34%,新价格将于2026年4月18日起正式生效。 这并
246
0
0
0
架构师李哲
架构师李哲
MiniMax M2.7开启“自我进化”:AI正从“被训练”走向“自己长大”
大模型人工智能
当大模型不再依赖人类投喂,而是开始自我迭代,Scaling Law 将被重新定义  “龙虾”还在增强基座模型,“悟空”刚刚成立事业部,而在刚刚过去的一周,一个看似低调却极具颠覆性的名词悄然浮出水面——AI自我进化。 在众多模型迭代和商业架构调整的新闻中,MiniMax 推出 M2.7 模型的这条消息,显得格外意味深长。它没有像英伟达的 Rubin 那样用 35 倍算力狂飙来吸引眼球,也没有像 Mi
153
0
0
0
架构师李哲
架构师李哲
把历史模型当“乐高”拼:一种新的微调加速范式
AI最佳实践
那些被你扔在硬盘角落的老模型,可能是新任务最快的起跑线 每个算法工程师的硬盘里,都躺着成百上千个历史checkpoint——上周跑的法律问答模型、上个月做的金融情感分析、去年调优的代码生成器……它们像乐高积木块,散落在角落里吃灰。 但如果我告诉你,这些被你遗忘的“老古董”可以像乐高一样拼起来,在特定条件下,新模型的训练耗时有望降低37% 3月10日上传至arXiv的一篇新论文,提出了一个名为 “M
73
0
0
0
架构师李哲
架构师李哲
全民都在“养龙虾”,但你真的会“喂”吗?OpenClaw爆火背后的微调玄机
AI大模型
你的AI是死记硬背,还是真的记住了你?2026年的春天,科技圈最火的话题不再是哪家的大模型参数又刷新了纪录,而是一只“小龙虾”。OpenClaw,这款因红色龙虾图标被网友昵称为“赛博龙虾”的开源AI智能体,正在以惊人的速度席卷全球。截至3月11日,OpenClaw的GitHub星标数已达29.8万,登顶全球最大的开发者社区GitHub软件星标榜,排在其之后的React、Linux星标数分别为24.
245
0
0
0
架构师李哲
架构师李哲
港科大这个AI突破,让大模型学会“偷懒”了
AI行业趋势
跳过88%的专家,保住97%的性能,推理速度翻倍——这项研究刚刚被CVPR接收  你有没有这种感觉:现在的AI越来越聪明,但也越来越“能吃”?一个能看图能聊天的多模态大模型,跑一次任务要调动几十上百个“专家”一起干活,算力消耗大得吓人。这也是为什么很多炫酷的AI功能只能跑在云端,手机里根本装不下。但3月5日,港科大团队放出一项被CVPR接收的新研究,可能会改变这个局面。  这项研究叫MoDES(多
66
0
0
0
架构师李哲
架构师李哲
只有2B参数,中文能力也能打架?手把手教你调教出更懂中文的“小钢炮”模型
大模型人工智能
在中文大模型的世界里,一个尴尬的现状长期存在:绝大多数模型的训练以英语为核心,中文语料往往只是“配料”。这就好比请了一位精通西餐的大厨来做中餐——食材认识,火候也对,但做出来的味道总差那么点意思。今天,我们要分享的是一次“反其道而行”的实践:在LlamaFactory Online平台上,仅用1小时,用Chinese Tiny LLM - 2B**这个小模型,通过精挑细选的中文数据和巧妙的“喂养”
70
0
0
0
架构师李哲
架构师李哲
DeepSeek V4全网猜测汇总:四大焦点浮出水面
AIAI开放平台大模型
AI圈近期的热度,几乎全被DeepSeek V4的相关猜测承包了。恰逢DeepSeek-R1发布一周年,官方GitHub代码库中突然曝光的“MODEL1”标识,瞬间点燃全网讨论热情。开发者拆解代码、外媒爆料动态、行业人士解读技术,各类声音层出不穷。今天我们梳理全网真实信息,聚焦大家最关心的四大核心焦点,看看各方都在热议什么~焦点一:发布时间——春节前后成共识,外媒与代码线索相互印证●发布时间:关于
503
0
0
0
架构师李哲
架构师李哲
还在做93道MBTI选择题?我们训了个AI,聊8句就能看透你
AI深度学习AIGC大模型
在上一篇《受够93道MBTI选择题?我调了一个测MBTI的专属AI》发出后,我们收到了不少用户的测试反馈,并在评论区看到了各式各样的回答。许多人感到好奇:为什么仅仅通过8个看似随意的问题,AI就能如此准确地判断一个人的MBTI类型?今天,我们将完全公开这个“对话式MBTI测试”背后的技术细节——从数据集构建、模型训练到评估优化,完整呈现一个专业的人格分析模型是如何被“炼”出来的。这不仅仅是一个有趣
294
0
0
0
架构师李哲
架构师李哲
受够93道MBTI选择题?我调了一个测MBTI的专属AI,回答8个问题就出结果,准确率99%
大模型AIGC深度学习大模型
在这个万物皆可MBTI的时代,人格类型几乎成了我们的社交名片。交朋友前先问一下“你的MBTI是什么”,立马就可以对一个人的性格有一个初步印象;就算交朋友用不上,找工作时也逃不过公司面试官的随意一问:“你测过MBTI吗?”于是你在开始网上四处找MBTI的测试链接,结果点开的帖子要不就是在卖链接,要么是 ”私信我”,发去私信之后,又要求关注公众号......折腾了一圈,终于用九牛二虎之力找到了官网免费
107
0
0
0
架构师李哲
架构师李哲
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
AIAI解决方案
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。 当一个任务效果不达预期,核心问题其实只有三个:● Prompt 写得不对 / 不完整● 
103
0
0
0
架构师李哲
架构师李哲
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
AIAI生态深度学习人工智能
仅用1.6万张医学影像,我们让大模型学会了“看片子”。患者提问:“请使用中文详细描述这张图像并给出你的诊断结果。” 这是微调前模型的回答。虽然能够识别出基本病变,但其分析存在明显不足,描述过于简略,仅关注单一病灶而忽略了图像中实际存在的双肺多发性结节,且诊断结论过于武断,直接定性为"良性肿瘤",缺乏严谨的鉴别诊断思路,临床参考价值有限。 这是微调后模型的回答。它成功化身为“严谨的放射科医生”,不仅
500
0
0
0
架构师李哲
架构师李哲
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
开源AIGC大模型开源
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。 当一个任务效果不达预期,核心问题其实只有三个:● Prompt 写得不对 / 不完整● 
170
0
0
0
架构师李哲
架构师李哲
开源算法能在 2025 年击败 GPT-5 吗?DeepSeek交出了答案
AIAIGC开源大模型
在很多人心里,“顶级推理能力”这几个字,长期等于三个关键词:闭源、大厂、昂贵。GPT-5、Gemini 3.0-Pro 像是少数玩家才能摸到的天花板,开源模型更多还停留在“追赶者”的角色。12月1日,DeepSeek发布的新一代的“双机组合”——V3.2 和 V3.2-Speciale,把这套共识拧了一下:一边是在综合推理上对齐 GPT-5、并且 MIT 协议开源的主力模型 DeepSeek-V3
190
0
0
0
架构师李哲
架构师李哲
PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末有大模型微调神器!
大模型AI解决方案
很多人第一次接触各家大模型时,都会觉得它们的回答能带来意想不到的惊喜,但有时,AI回答又怪怪的、啰嗦、甚至有点危险。  这背后,其实就是一个核心问题:对齐(Alignment)。    预训练让模型会“说话”,但对齐训练,才让模型更符合人类偏好:更有用、更安全、更有温度。在当下的大模型时代,有三种常被提到的对齐方法:PPO、DPO和KTO。  本期,LLaMA-Factory Online将用尽量
1088
2
0
0
架构师李哲
架构师李哲
别再烧钱做AI!大模型微调GPU终极指南:从入门到放弃?
AIAI生态人工智能
微调7b模型至少要什么显卡?算力低一些的总感觉比不过别人...有没有一种可能,让我普通老百姓也用用H卡? 以上问题是否曾是干扰大家做出选品决策的苦楚?别急,本文将从底层逻辑到实战方案,帮你彻底理清选卡思路。顺带一提,普通人也能接触H卡,只要你的电脑能连上网!已经没有选择焦虑、但想挑战大模型微调训练上限的朋友们,可以直接翻到后面看如何平价入手了! 选卡并非越贵越好,而是追求预算与需求的最优匹配。请先
213
1
0
0