文档备案控制台登录立即注册
首页
AI 大模型体验中心AI 大模型体验中心AI 大模型体验中心
动手实验室动手实验室动手实验室
Agent 评测集Agent 评测集Agent 评测集
AI 案例广场AI 案例广场AI 案例广场
火山杯大赛学习中心
社区
去发布
首页
AI 大模型体验中心AI 大模型体验中心AI 大模型体验中心
动手实验室动手实验室动手实验室
Agent 评测集Agent 评测集Agent 评测集
AI 案例广场AI 案例广场AI 案例广场
学习中心
社区
架构师李哲
架构师李哲
文章
专栏
问答
架构师李哲
架构师李哲
阿里云突然宣布:最高涨34%!告别“价格战”,AI算力正式进入稀缺时代
AI大模型
当云计算行业持续十几年的低价内卷成为过去式,一场由AI需求引爆的算力涨价潮,正彻底改写行业规则。 2026年3月18日午间,阿里云官网正式发布调价公告,瞬间在云计算、AI产业圈引发轩然大波。受全球AI算力需求爆发式增长、核心硬件供应链成本持续攀升等多重因素影响,阿里云将对AI算力、高性能存储等核心产品上调价格,其中部分AI算力产品最高涨幅达到34%,新价格将于2026年4月18日起正式生效。 这并
17
0
0
0
架构师李哲
架构师李哲
MiniMax M2.7开启“自我进化”:AI正从“被训练”走向“自己长大”
大模型人工智能
当大模型不再依赖人类投喂,而是开始自我迭代,Scaling Law 将被重新定义  “龙虾”还在增强基座模型,“悟空”刚刚成立事业部,而在刚刚过去的一周,一个看似低调却极具颠覆性的名词悄然浮出水面——AI自我进化。 在众多模型迭代和商业架构调整的新闻中,MiniMax 推出 M2.7 模型的这条消息,显得格外意味深长。它没有像英伟达的 Rubin 那样用 35 倍算力狂飙来吸引眼球,也没有像 Mi
27
0
0
0
架构师李哲
架构师李哲
把历史模型当“乐高”拼:一种新的微调加速范式
AI最佳实践
那些被你扔在硬盘角落的老模型,可能是新任务最快的起跑线 每个算法工程师的硬盘里,都躺着成百上千个历史checkpoint——上周跑的法律问答模型、上个月做的金融情感分析、去年调优的代码生成器……它们像乐高积木块,散落在角落里吃灰。 但如果我告诉你,这些被你遗忘的“老古董”可以像乐高一样拼起来,在特定条件下,新模型的训练耗时有望降低37% 3月10日上传至arXiv的一篇新论文,提出了一个名为 “M
18
0
0
0
架构师李哲
架构师李哲
全民都在“养龙虾”,但你真的会“喂”吗?OpenClaw爆火背后的微调玄机
AI大模型
你的AI是死记硬背,还是真的记住了你?2026年的春天,科技圈最火的话题不再是哪家的大模型参数又刷新了纪录,而是一只“小龙虾”。OpenClaw,这款因红色龙虾图标被网友昵称为“赛博龙虾”的开源AI智能体,正在以惊人的速度席卷全球。截至3月11日,OpenClaw的GitHub星标数已达29.8万,登顶全球最大的开发者社区GitHub软件星标榜,排在其之后的React、Linux星标数分别为24.
88
0
0
0
架构师李哲
架构师李哲
港科大这个AI突破,让大模型学会“偷懒”了
AI行业趋势
跳过88%的专家,保住97%的性能,推理速度翻倍——这项研究刚刚被CVPR接收  你有没有这种感觉:现在的AI越来越聪明,但也越来越“能吃”?一个能看图能聊天的多模态大模型,跑一次任务要调动几十上百个“专家”一起干活,算力消耗大得吓人。这也是为什么很多炫酷的AI功能只能跑在云端,手机里根本装不下。但3月5日,港科大团队放出一项被CVPR接收的新研究,可能会改变这个局面。  这项研究叫MoDES(多
16
0
0
0
架构师李哲
架构师李哲
只有2B参数,中文能力也能打架?手把手教你调教出更懂中文的“小钢炮”模型
大模型人工智能
在中文大模型的世界里,一个尴尬的现状长期存在:绝大多数模型的训练以英语为核心,中文语料往往只是“配料”。这就好比请了一位精通西餐的大厨来做中餐——食材认识,火候也对,但做出来的味道总差那么点意思。今天,我们要分享的是一次“反其道而行”的实践:在LlamaFactory Online平台上,仅用1小时,用Chinese Tiny LLM - 2B**这个小模型,通过精挑细选的中文数据和巧妙的“喂养”
24
0
0
0
架构师李哲
架构师李哲
DeepSeek V4全网猜测汇总:四大焦点浮出水面
AIAI开放平台大模型
AI圈近期的热度,几乎全被DeepSeek V4的相关猜测承包了。恰逢DeepSeek-R1发布一周年,官方GitHub代码库中突然曝光的“MODEL1”标识,瞬间点燃全网讨论热情。开发者拆解代码、外媒爆料动态、行业人士解读技术,各类声音层出不穷。今天我们梳理全网真实信息,聚焦大家最关心的四大核心焦点,看看各方都在热议什么~焦点一:发布时间——春节前后成共识,外媒与代码线索相互印证●发布时间:关于
337
0
0
0
架构师李哲
架构师李哲
还在做93道MBTI选择题?我们训了个AI,聊8句就能看透你
AI深度学习AIGC大模型
在上一篇《受够93道MBTI选择题?我调了一个测MBTI的专属AI》发出后,我们收到了不少用户的测试反馈,并在评论区看到了各式各样的回答。许多人感到好奇:为什么仅仅通过8个看似随意的问题,AI就能如此准确地判断一个人的MBTI类型?今天,我们将完全公开这个“对话式MBTI测试”背后的技术细节——从数据集构建、模型训练到评估优化,完整呈现一个专业的人格分析模型是如何被“炼”出来的。这不仅仅是一个有趣
171
0
0
0
架构师李哲
架构师李哲
受够93道MBTI选择题?我调了一个测MBTI的专属AI,回答8个问题就出结果,准确率99%
大模型AIGC深度学习大模型
在这个万物皆可MBTI的时代,人格类型几乎成了我们的社交名片。交朋友前先问一下“你的MBTI是什么”,立马就可以对一个人的性格有一个初步印象;就算交朋友用不上,找工作时也逃不过公司面试官的随意一问:“你测过MBTI吗?”于是你在开始网上四处找MBTI的测试链接,结果点开的帖子要不就是在卖链接,要么是 ”私信我”,发去私信之后,又要求关注公众号......折腾了一圈,终于用九牛二虎之力找到了官网免费
47
0
0
0
架构师李哲
架构师李哲
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
AIAI解决方案
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。 当一个任务效果不达预期,核心问题其实只有三个:● Prompt 写得不对 / 不完整● 
69
0
0
0
架构师李哲
架构师李哲
16k数据撬动300亿大模型!我用Qwen3-VL打造了一位“顶尖放射科医生”
AIAI生态深度学习人工智能
仅用1.6万张医学影像,我们让大模型学会了“看片子”。患者提问:“请使用中文详细描述这张图像并给出你的诊断结果。” 这是微调前模型的回答。虽然能够识别出基本病变,但其分析存在明显不足,描述过于简略,仅关注单一病灶而忽略了图像中实际存在的双肺多发性结节,且诊断结论过于武断,直接定性为"良性肿瘤",缺乏严谨的鉴别诊断思路,临床参考价值有限。 这是微调后模型的回答。它成功化身为“严谨的放射科医生”,不仅
381
0
0
0
架构师李哲
架构师李哲
当 AI 落地到了“深水区”:到底是 Prompt 不行、RAG 不够,还是该考虑微调了?
开源AIGC大模型开源
这两年,大家对大模型已经不再停留在“技术演示多酷炫”,而是越来越现实地问一句:“为什么模型看起来很强,但真要放进我们自己的业务里,用起来总差点意思?尤其是——明明接入了私域知识库,效果还是不稳定?”答案往往不在某一个“神技”,而是在你怎么 同时使用 Prompt、RAG 和微调,以及它们和业务的“耦合深度”。 当一个任务效果不达预期,核心问题其实只有三个:● Prompt 写得不对 / 不完整● 
124
0
0
0
架构师李哲
架构师李哲
开源算法能在 2025 年击败 GPT-5 吗?DeepSeek交出了答案
AIAIGC开源大模型
在很多人心里,“顶级推理能力”这几个字,长期等于三个关键词:闭源、大厂、昂贵。GPT-5、Gemini 3.0-Pro 像是少数玩家才能摸到的天花板,开源模型更多还停留在“追赶者”的角色。12月1日,DeepSeek发布的新一代的“双机组合”——V3.2 和 V3.2-Speciale,把这套共识拧了一下:一边是在综合推理上对齐 GPT-5、并且 MIT 协议开源的主力模型 DeepSeek-V3
125
0
0
0
架构师李哲
架构师李哲
PPO最强,DPO一般?一文带你了解常见三种强化学习方法,文末有大模型微调神器!
大模型AI解决方案
很多人第一次接触各家大模型时,都会觉得它们的回答能带来意想不到的惊喜,但有时,AI回答又怪怪的、啰嗦、甚至有点危险。  这背后,其实就是一个核心问题:对齐(Alignment)。    预训练让模型会“说话”,但对齐训练,才让模型更符合人类偏好:更有用、更安全、更有温度。在当下的大模型时代,有三种常被提到的对齐方法:PPO、DPO和KTO。  本期,LLaMA-Factory Online将用尽量
993
2
0
0
架构师李哲
架构师李哲
别再烧钱做AI!大模型微调GPU终极指南:从入门到放弃?
AIAI生态人工智能
微调7b模型至少要什么显卡?算力低一些的总感觉比不过别人...有没有一种可能,让我普通老百姓也用用H卡? 以上问题是否曾是干扰大家做出选品决策的苦楚?别急,本文将从底层逻辑到实战方案,帮你彻底理清选卡思路。顺带一提,普通人也能接触H卡,只要你的电脑能连上网!已经没有选择焦虑、但想挑战大模型微调训练上限的朋友们,可以直接翻到后面看如何平价入手了! 选卡并非越贵越好,而是追求预算与需求的最优匹配。请先
160
1
0
0
架构师李哲
架构师李哲
LMArena中文榜大洗牌:国产大模型包揽前列,GPT-4 Turbo跌出百名开外
大数据最佳实践技术解析Agent
就在百度世界大会前夕,全球最具影响力的大模型评测平台LMArena发布的最新排名,让海外开发者社区发出了"Baidu is back?"的惊叹。这份发布于2025年11月初的榜单显示,国产大模型在中文竞技场上实现了对国际顶尖模型的全面反超,这一突破性进展恰如其时地展现了中国AI技术的迅猛发展。在LMArena最新发布的排名当中,文心全新模型ERNIE-5.0-Preview-1022首次上榜,就登
635
0
0
0
架构师李哲
架构师李哲
数据不够怎么办?新加坡国立大学揭秘扩散语言模型的“秘密武器”
大数据最佳实践行业趋势技术解析
当大模型陷入“数据饥渴”,我们是否只能无止境地堆砌算力与语料?新加坡国立大学的最新研究给出了否定答案。本期将深入解读其提出的扩散语言模型(DLM),揭示它如何在有限数据下实现比肩甚至超越自回归模型的性能——这不仅是一场技术路径的革新,更可能是破解当前AI训练数据瓶颈的关键密钥。聚焦过去一周AI领域最具热度与争议性的技术动态与行业事件。快速筛选并解读热点背后的逻辑与影响,追踪技术浪潮的脉搏。 LLM
122
0
0
0
架构师李哲
架构师李哲
别再“调教”ChatGPT了!用Qwen2.5打造24小时在线数字分身
AI最佳实践行业趋势技术解析
在人工智能浪潮席卷的今天,一个曾经只存在于科幻作品中的概念正在成为现实:每个人都能拥有专属的"数字分身"。想象一下《钢铁侠》中的经典场景:托尼·斯塔克的智能管家"贾维斯"能够精准理解主人的需求,自主处理各种事务。现在,这样的智能助手不再遥不可及——当你结束一天的工作,你的数字分身正在与客户进行专业交流,每句话都带着你特有的表达习惯;当朋友发来咨询,它能用你习惯的幽默语气给出建议;甚至当家人需要陪伴
99
0
0
0
架构师李哲
架构师李哲
我用单张显卡跑了个“法律顾问”,靠它成功追回了加班费
大数据人工智能AIGC大模型
遇到劳动纠纷,你是否也面临这样的困境?翻遍《劳动法》,却找不到能精准对应自身情况的条款。想咨询律师,又因费用高昂、案情梳理不清而难以获得有效指导。试图与公司协商,却因不熟悉法律术语,被HR几句“专业说辞”轻易劝退。上述痛点,正是大模型技术能够发力之处。然而,通用大模型虽强,其知识的静态滞后性与专业领域的“幻觉”问题也尤为突出。为此,我上周在LLaMA-Factory Online的「实例空间」中,
100
0
0
0
架构师李哲
架构师李哲
2小时打造专业医疗助手:基于CareGPT与Qwen3-8B的微调实战
大模型最佳实践低代码云计算
凌晨一点,突发剧烈头痛,视力也开始模糊。在这种紧急情况下,使用通用AI助手寻求建议,往往只能得到“请及时就医”这样正确但无用的回答。用户真正需要的,是具备初步症状识别、风险评估和就医指引能力的专业助手。 这正是当前通用大模型在医疗场景中的典型短板:缺乏专业医学知识体系,无法进行症状关联分析回答过于保守,难以提供具针对性的分级建议无法识别症状组合背后的潜在疾病类型差异现在,通过LLaMA-Facto
163
0
0
0