文档
备案
控制台
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
火山杯大赛
学习中心
社区
去发布
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
架构师李哲
文章
专栏
问答
架构师李哲
AI当审稿人,得分比人类还高?AAAI-26的22,977篇论文实验
大模型
人工智能
顶会投稿量暴涨近一倍,AI用不到一天审完2.3万篇论文,学者说:它比人审得好 如果告诉你,你投给顶会的论文,会有一个AI来审,你会怎么想? 这不是科幻小说。2026年4月15日,AAAI(人工智能促进协会)年会发布了一份重磅研究报告:AAAI-26首次大规模部署AI辅助审稿,22,977篇投稿论文,每一篇都收到了一份由AI生成的评审意见。 结果出人意料——参与调查的学者们不仅觉得AI审稿有用,而且
66
0
0
0
架构师李哲
平台上新!Gemma 4 全系模型正式上线:不止于迭代,更是架构新探索
大模型
人工智能
谷歌开源家族再添新成员,MoE + 稠密 + 实验架构,四款齐发Gemma 4 系列模型已正式在我们平台上线。本次共推出 4 款不同规格,覆盖高效推理、稳定性能和架构探索等多重场景。本次上新的 Gemma 4 模型如下(型号已按平台规范命名,与官方规格一一对应): | 模型 | 规格说明 | | -------------
195
0
0
0
架构师李哲
从菜鸟到高手:LlamaFactory官方超参数终极指南(建议收藏)
AI
人工智能
大模型微调是让通用模型走向垂直领域的必经之路。然而,面对 LlamaFactory 面板上密密麻麻的超参数,很多开发者常感到"无从下手":为什么 Loss 不下降?为什么模型学成了"复读机"?今天,LlamaFactory Online 官方团队特别邀请到了我们的算法专家为大家带来一期大模型微调超参数的深度解析。 【【LlamaFactory Online】大模型微调超参数全解析:从入门到上手,
233
0
0
0
架构师李哲
别再死磕SFT了!用KTO微调Qwen3-14B,数据减半效果翻倍
AI
人工智能
如果你已经用LlamaFactory Online微调过模型,大概率接触过SFT(监督微调) 和RLHF(基于人类反馈的强化学习)。前者需要精心构造“问题-答案”对,后者则需要收集大量的偏好对比数据——标注员要反复比较两个回答哪个更好,成本高、流程繁琐。 那么,有没有一种方法,既能利用偏好数据,又不需要成对比较? KTO(Kahneman-Tversky Optimization) 就是答案。它受
168
0
0
0
架构师李哲
中国AI音乐,全球登顶!Mureka V8击败Suno、Udio,拿下权威榜单双料冠军
AI
人工智能
AI音乐的“王者宝座”,第一次属于中国 先戴上耳机。听听下面这首歌。Mureka你能分辨出来,这是AI生成的,还是真人演唱的吗?答案是:全部由AI生成。那些听起来与真人演唱无异、连气息和换气声都拿捏得恰到好处的歌曲,出自中国AI音乐大模型——Mureka V8之手。就在刚刚过去的几天里,中国AI在世界舞台上投下了一枚重磅炸弹。 Artificial Analysis——被誉为“AI领域的Gar
361
0
0
0
架构师李哲
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账
AI
人工智能
告别“令牌”与“智元”之争,“词元”定名背后的140万亿经济账 一个名字的变化,正在撬动一套全新的万亿级商业规则。 Token—这个曾只在技术圈流传的词汇,如今频繁进入大众视野:以它计费的AI应用火热出圈,云厂商更新计费体系,海外热议“中国Token”。 在喧嚣中,2026年3月23日,国家数据局局长刘烈宏在中国发展高层论坛2026年年会上明确:Token的中文正式定为“词元”。 他将其定义为智能
143
0
0
0
架构师李哲
英伟达用AI智能体7天自主优化GPU内核,超越人类专家
AI
人工智能
人类认知能力,已成为软件工程的瓶颈 这应该是2026年3月最炸裂的科技新闻。在很多算子开发者的微信群里,已经掀起了轩然大波。“这或许是超人类智能在软件领域的真正首次展露。”英伟达研究员许冰刚刚在X上发出了如此断言。他所评论的,正是他与Terry Chen和Zhifan Ye为共同一作的一项英伟达新研究——AVO。在这项刚刚提交到arXiv上的研究中,英伟达构建了Agentic Variation
319
0
0
0
架构师李哲
阿里云突然宣布:最高涨34%!告别“价格战”,AI算力正式进入稀缺时代
AI
大模型
当云计算行业持续十几年的低价内卷成为过去式,一场由AI需求引爆的算力涨价潮,正彻底改写行业规则。 2026年3月18日午间,阿里云官网正式发布调价公告,瞬间在云计算、AI产业圈引发轩然大波。受全球AI算力需求爆发式增长、核心硬件供应链成本持续攀升等多重因素影响,阿里云将对AI算力、高性能存储等核心产品上调价格,其中部分AI算力产品最高涨幅达到34%,新价格将于2026年4月18日起正式生效。 这并
634
0
0
0
架构师李哲
MiniMax M2.7开启“自我进化”:AI正从“被训练”走向“自己长大”
大模型
人工智能
当大模型不再依赖人类投喂,而是开始自我迭代,Scaling Law 将被重新定义 “龙虾”还在增强基座模型,“悟空”刚刚成立事业部,而在刚刚过去的一周,一个看似低调却极具颠覆性的名词悄然浮出水面——AI自我进化。 在众多模型迭代和商业架构调整的新闻中,MiniMax 推出 M2.7 模型的这条消息,显得格外意味深长。它没有像英伟达的 Rubin 那样用 35 倍算力狂飙来吸引眼球,也没有像 Mi
294
0
0
0
架构师李哲
把历史模型当“乐高”拼:一种新的微调加速范式
AI
最佳实践
那些被你扔在硬盘角落的老模型,可能是新任务最快的起跑线 每个算法工程师的硬盘里,都躺着成百上千个历史checkpoint——上周跑的法律问答模型、上个月做的金融情感分析、去年调优的代码生成器……它们像乐高积木块,散落在角落里吃灰。 但如果我告诉你,这些被你遗忘的“老古董”可以像乐高一样拼起来,在特定条件下,新模型的训练耗时有望降低37% 3月10日上传至arXiv的一篇新论文,提出了一个名为 “M
121
0
0
0
架构师李哲
全民都在“养龙虾”,但你真的会“喂”吗?OpenClaw爆火背后的微调玄机
AI
大模型
你的AI是死记硬背,还是真的记住了你?2026年的春天,科技圈最火的话题不再是哪家的大模型参数又刷新了纪录,而是一只“小龙虾”。OpenClaw,这款因红色龙虾图标被网友昵称为“赛博龙虾”的开源AI智能体,正在以惊人的速度席卷全球。截至3月11日,OpenClaw的GitHub星标数已达29.8万,登顶全球最大的开发者社区GitHub软件星标榜,排在其之后的React、Linux星标数分别为24.
458
0
0
0
架构师李哲
港科大这个AI突破,让大模型学会“偷懒”了
AI
行业趋势
跳过88%的专家,保住97%的性能,推理速度翻倍——这项研究刚刚被CVPR接收 你有没有这种感觉:现在的AI越来越聪明,但也越来越“能吃”?一个能看图能聊天的多模态大模型,跑一次任务要调动几十上百个“专家”一起干活,算力消耗大得吓人。这也是为什么很多炫酷的AI功能只能跑在云端,手机里根本装不下。但3月5日,港科大团队放出一项被CVPR接收的新研究,可能会改变这个局面。 这项研究叫MoDES(多
102
0
0
0
架构师李哲
只有2B参数,中文能力也能打架?手把手教你调教出更懂中文的“小钢炮”模型
大模型
人工智能
在中文大模型的世界里,一个尴尬的现状长期存在:绝大多数模型的训练以英语为核心,中文语料往往只是“配料”。这就好比请了一位精通西餐的大厨来做中餐——食材认识,火候也对,但做出来的味道总差那么点意思。今天,我们要分享的是一次“反其道而行”的实践:在LlamaFactory Online平台上,仅用1小时,用Chinese Tiny LLM - 2B**这个小模型,通过精挑细选的中文数据和巧妙的“喂养”
96
0
0
0
架构师李哲
DeepSeek V4全网猜测汇总:四大焦点浮出水面
AI
AI开放平台
大模型
AI圈近期的热度,几乎全被DeepSeek V4的相关猜测承包了。恰逢DeepSeek-R1发布一周年,官方GitHub代码库中突然曝光的“MODEL1”标识,瞬间点燃全网讨论热情。开发者拆解代码、外媒爆料动态、行业人士解读技术,各类声音层出不穷。今天我们梳理全网真实信息,聚焦大家最关心的四大核心焦点,看看各方都在热议什么~焦点一:发布时间——春节前后成共识,外媒与代码线索相互印证●发布时间:关于
779
0
0
0
架构师李哲
还在做93道MBTI选择题?我们训了个AI,聊8句就能看透你
AI
深度学习
AIGC
大模型
在上一篇《受够93道MBTI选择题?我调了一个测MBTI的专属AI》发出后,我们收到了不少用户的测试反馈,并在评论区看到了各式各样的回答。许多人感到好奇:为什么仅仅通过8个看似随意的问题,AI就能如此准确地判断一个人的MBTI类型?今天,我们将完全公开这个“对话式MBTI测试”背后的技术细节——从数据集构建、模型训练到评估优化,完整呈现一个专业的人格分析模型是如何被“炼”出来的。这不仅仅是一个有趣
442
0
0
0
架构师李哲
受够93道MBTI选择题?我调了一个测MBTI的专属AI,回答8个问题就出结果,准确率99%
大模型
AIGC
深度学习
大模型
在这个万物皆可MBTI的时代,人格类型几乎成了我们的社交名片。交朋友前先问一下“你的MBTI是什么”,立马就可以对一个人的性格有一个初步印象;就算交朋友用不上,找工作时也逃不过公司面试官的随意一问:“你测过MBTI吗?”于是你在开始网上四处找MBTI的测试链接,结果点开的帖子要不就是在卖链接,要么是 ”私信我”,发去私信之后,又要求关注公众号......折腾了一圈,终于用九牛二虎之力找到了官网免费
230
0
0
0
架构师李哲
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
AI
AI解决方案
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。 当一个任务效果不达预期,核心问题其实只有三个:● Prompt 写得不对 / 不完整●
123
0
0
0
架构师李哲
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
AI
AI生态
深度学习
人工智能
仅用1.6万张医学影像,我们让大模型学会了“看片子”。患者提问:“请使用中文详细描述这张图像并给出你的诊断结果。” 这是微调前模型的回答。虽然能够识别出基本病变,但其分析存在明显不足,描述过于简略,仅关注单一病灶而忽略了图像中实际存在的双肺多发性结节,且诊断结论过于武断,直接定性为"良性肿瘤",缺乏严谨的鉴别诊断思路,临床参考价值有限。 这是微调后模型的回答。它成功化身为“严谨的放射科医生”,不仅
687
0
0
0
架构师李哲
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
开源
AIGC
大模型
开源
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。 当一个任务效果不达预期,核心问题其实只有三个:● Prompt 写得不对 / 不完整●
244
0
0
0
架构师李哲
开源算法能在 2025 年击败 GPT-5 吗?DeepSeek交出了答案
AI
AIGC
开源
大模型
在很多人心里,“顶级推理能力”这几个字,长期等于三个关键词:闭源、大厂、昂贵。GPT-5、Gemini 3.0-Pro 像是少数玩家才能摸到的天花板,开源模型更多还停留在“追赶者”的角色。12月1日,DeepSeek发布的新一代的“双机组合”——V3.2 和 V3.2-Speciale,把这套共识拧了一下:一边是在综合推理上对齐 GPT-5、并且 MIT 协议开源的主力模型 DeepSeek-V3
243
0
0
0