文档备案控制台登录立即注册
首页
AI 大模型体验中心AI 大模型体验中心AI 大模型体验中心
动手实验室动手实验室动手实验室
Agent 评测集Agent 评测集Agent 评测集
AI 案例广场AI 案例广场AI 案例广场
火山杯大赛学习中心
社区
去发布
首页
AI 大模型体验中心AI 大模型体验中心AI 大模型体验中心
动手实验室动手实验室动手实验室
Agent 评测集Agent 评测集Agent 评测集
AI 案例广场AI 案例广场AI 案例广场
学习中心
社区
AI浩
AI浩
文章
专栏
问答
AI浩
AI浩
uvloop深度实践:从原理到高性能异步应用实战
技术最佳实践
你是否遇到过Python异步代码看似"并发"却跑不快?标准库的默认事件循环像套了减速带?uvloop正是异步编程的"性能加速器"——这个基于的高性能事件循环库,能让你的异步代码效率直接拉满。在Python异步编程领域,asyncio是官方标准库,但其默认事件循环在高并发场景下性能有限。uvloop作为asyncio事件循环的替代品,能将异步代码性能提升200%-400%,使Python异步应用的性
201
0
0
0
AI浩
AI浩
QLoRA与LoRA的深度对比:从原理到实践(小白友好版)
AIdeepseek最佳实践
LoRA是"给大模型打补丁"的技术,只训练少量参数;QLoRA = 4-bit压缩大模型 + LoRA补丁,让普通电脑也能微调大模型。传统微调:修改整个大模型的所有参数(像给整栋大楼重新装修)问题:7B模型需要14GB显存,训练成本极高LoRA:只训练"参数补丁"(像只装修关键房间)核心思想:冻结原始模型,仅训练低秩分解的小矩阵假设原始权重矩阵 $W$(维度 $d \times k$):直接微调需
602
0
0
0
AI浩
AI浩
快速Transformer解码:一个写头就足够了
AIdeepseek技术解析
https://arxiv.org/pdf/1911.02150Transformer神经序列模型中使用的多头注意力层是一种强大的替代RNN的方法,用于在序列内部和序列之间传递信息。虽然由于序列长度上的并行化,训练这些层通常快速且简单,但增量推理(在这种情况下并行化是不可能的)通常较慢,这是由于反复加载大型"键"和"值"张量所带来的内存带宽成本。我们提出了一种称为多查询注意力的变体,其中键和值在所
24
0
0
0
AI浩
AI浩
【手把手教学】大模型“性格“调节指南:3个参数让你的AI听话又有趣
AIdeepseek最佳实践
你是不是也遇到过这种情况:让AI写个产品介绍,它要么像机器人念说明书,要么放飞自我写成科幻小说?别急,今天教你用3个神奇参数,把AI从"杠精"调成"知心伙伴"!试试看:复制以下提示词到任意AI工具(如ChatGPT、文心一言等),分别用两组参数生成:| 参数组合 | 你的设置 | 我的实测效果 | |---------|---------|------------| | 严谨模式 | 温度=0.3
281
0
0
0
AI浩
AI浩
字节跳动Seed-OSS-36B-Instruct:开源大模型新标杆,512K长上下文与智能推理的完
AIdeepseek最佳实践
2025年8月20日,字节跳动Seed团队正式发布Seed-OSS-36B系列模型,包括Seed-OSS-36B-Base(含合成数据和无合成数据两个版本)以及Seed-OSS-36B-Instruct指令微调模型。 作为开源AI领域的重要里程碑,这一360亿参数的模型凭借其创新特性和卓越性能,迅速成为开发者社区的焦点。Seed-OSS-36B-Instruct是字节跳动Seed团队开发的开源大语
434
0
0
0