AI浩的个人主页 - 开发者社区

uvloop深度实践：从原理到高性能异步应用实战

技术最佳实践

你是否遇到过Python异步代码看似"并发"却跑不快？标准库的默认事件循环像套了减速带？uvloop正是异步编程的"性能加速器"——这个基于的高性能事件循环库，能让你的异步代码效率直接拉满。在Python异步编程领域，asyncio是官方标准库，但其默认事件循环在高并发场景下性能有限。uvloop作为asyncio事件循环的替代品，能将异步代码性能提升200%-400%，使Python异步应用的性

361

AI浩

QLoRA与LoRA的深度对比：从原理到实践（小白友好版）

AIdeepseek最佳实践

LoRA是"给大模型打补丁"的技术，只训练少量参数；QLoRA = 4-bit压缩大模型 + LoRA补丁，让普通电脑也能微调大模型。传统微调：修改整个大模型的所有参数（像给整栋大楼重新装修）问题：7B模型需要14GB显存，训练成本极高LoRA：只训练"参数补丁"（像只装修关键房间）核心思想：冻结原始模型，仅训练低秩分解的小矩阵假设原始权重矩阵 $W$（维度 $d \times k$）：直接微调需

1013

AI浩

快速Transformer解码：一个写头就足够了

AIdeepseek技术解析

https://arxiv.org/pdf/1911.02150Transformer神经序列模型中使用的多头注意力层是一种强大的替代RNN的方法，用于在序列内部和序列之间传递信息。虽然由于序列长度上的并行化，训练这些层通常快速且简单，但增量推理（在这种情况下并行化是不可能的）通常较慢，这是由于反复加载大型"键"和"值"张量所带来的内存带宽成本。我们提出了一种称为多查询注意力的变体，其中键和值在所

AI浩

【手把手教学】大模型“性格“调节指南：3个参数让你的AI听话又有趣

AIdeepseek最佳实践

你是不是也遇到过这种情况：让AI写个产品介绍，它要么像机器人念说明书，要么放飞自我写成科幻小说？别急，今天教你用3个神奇参数，把AI从"杠精"调成"知心伙伴"！试试看：复制以下提示词到任意AI工具（如ChatGPT、文心一言等），分别用两组参数生成：| 参数组合 | 你的设置 | 我的实测效果 | |---------|---------|------------| | 严谨模式 | 温度=0.3

575

AI浩

字节跳动Seed-OSS-36B-Instruct：开源大模型新标杆，512K长上下文与智能推理的完

AIdeepseek最佳实践

2025年8月20日，字节跳动Seed团队正式发布Seed-OSS-36B系列模型，包括Seed-OSS-36B-Base（含合成数据和无合成数据两个版本）以及Seed-OSS-36B-Instruct指令微调模型。作为开源AI领域的重要里程碑，这一360亿参数的模型凭借其创新特性和卓越性能，迅速成为开发者社区的焦点。Seed-OSS-36B-Instruct是字节跳动Seed团队开发的开源大语

725