Django 之父 Simon Willison ~ AI LLM 编程笔记：两年实战淬炼的十条效率心法 - 文章 - 开发者社区

picture.image

| 引言

作为 Django 框架联合创始人、Datasette 开源项目作者，Simon Willison 的每一篇技术长文都是开发者社区的"硬通货"。在最新发布的实战指南中，这位日均产出200行生产代码的全栈老兵，毫无保留地公开了他与 LLM 协作的工程化操作手册——没有浮夸的"取代论调"，只有经80+工具验证的代码生成策略、被数十次 Git 提交记录的调试实录，以及一个固执工程师对自动化边界的深刻反思。

当主流讨论还在围绕" AI 能否写代码"打转时，Willison 已默默构建起一整套 LLM 协作范式：从精准控制上下文的对话切割术，到规避幻觉的沙盒测试流，再到将开发速度提升5倍的 Vibe Coding 式原型法。本文将逐帧解析这篇"工程师写给工程师"的指南，揭秘如何将 LLM 锻造成可落地的生产力杠杆。

| 核心理念：人机协作的平衡

Willison 强调，LLM 并非替代开发者，而是“过度自信的结对编程助手”。其核心价值在于：

加速重复性工作：如生成样板代码、查找文档示例。
探索性学习工具：快速原型验证，降低试错成本。
知识辅助：解答代码库问题，缩短上下文切换时间。

但开发者需始终掌握最终决策权，尤其在系统设计、安全性和关键逻辑上。

picture.image

| 十大关键策略解析

设定合理期望

技术本质：LLM 本质是“基于概率的自动补全”，擅长模式匹配而非逻辑推理。
能力边界：可处理明确模式（如 API 调用、数据解析），但难以设计复杂算法。
应用场景：适合生成代码片段、修复简单 Bug、撰写测试用例，而非端到端开发。

训练截止日期的影响

数据时效性：如 GPT-4 训练数据截止至2023年10月，无法理解此后新库（如 Python 3.12 特性）。
应对策略：
- 优先选择稳定库（如requests而非httpx的新版本）。
- 主动提供新库文档作为上下文（如粘贴 FastAPI 最新教程）。

上下文管理的艺术

对话重置：复杂任务中，旧对话的残留上下文可能导致模型偏离目标。适时清空对话可提高效率。
上下文注入技巧：
- 代码示例：先提供相似功能的代码，再要求修改。
- 分步引导：首先生成简单实现，再逐步添加功能（如“先实现下载，再添加重试逻辑”）。

技术调研的智能化

Prompt 设计：
- 开放性问题：“Rust 中有哪些异步 HTTP 客户端？给出优缺点和示例。”
- 对比分析：“比较 Pandas 与 Polars 在大数据处理中的性能。”
输出处理：模型可能遗漏冷门库，需人工补充调研。

精确的任务指令

函数级生成：定义清晰的函数签名和需求，让模型填充实现。例如：

  
async def fetch_data(url: str, retries: int=3) -> list[dict]:  
      """Fetch JSON data with retries and timeout handling."""  
      # 模型生成具体实现

代码风格控制：通过注释指定格式（如“使用 Black 格式化”、“添加类型注解”）。

测试的不可替代性

典型陷阱：
- 模型可能忽略边缘情况（如网络超时、空数据）。
- 生成代码可能存在安全漏洞（如 SQL 注入）。
测试策略：
- 要求模型生成测试用例（“用 pytest 为上述函数编写测试”）。
- 结合覆盖率工具（如 Coverage.py）验证。

迭代式对话

错误修正流程：
1. 定位问题：运行代码，记录错误信息。
2. 精准反馈：“第30行的parse\_response未处理 JSONDecodeError。”
3. 要求重构：“将重复代码提取为validate\_response函数。”
进阶技巧：要求模型解释代码逻辑（“为什么在此处使用线程池？”），以验证其理解。

沙箱化执行环境

推荐工具：
- ChatGPT Code Interpreter：安全执行 Python 代码，适合数据处理任务。
- Claude Artifacts：实时预览 Web 应用，避免本地环境配置。
风险警示：避免在生产环境直接运行未审核的代码。

“直觉编程”的实践价值（Vibe Coding）

学习路径：
- 快速实验：通过修改提示观察输出变化（如调整 CSS 布局参数）。
- 知识沉淀：积累可复用的 Prompt 模板（如“生成 Flask CRUD 应用”）。
案例参考：作者通过构建70+小型工具（如 OCR 处理、社交媒体裁剪），积累了丰富的提示模式。

专业知识放大效应

杠杆效应：熟悉 React 的开发者能更高效引导模型生成组件代码。
知识迁移：将领域经验转化为精准的 Prompt 约束（如“遵循 RESTful 规范”）。

| 实战案例深度拆解：Colophon 页面开发

需求拆解：
- 目标：自动化生成记录工具开发历史的页面。
- 技术点：解析 Git 历史、生成 JSON、构建静态页面、自定义部署流程。
Prompt 设计：
- 数据收集：精确描述期望的 JSON 结构，指定 Python 脚本行为。
- 页面生成：要求移动端友好、时间排序、交互式元素。
问题调试：
- 错误检测：发现提交历史排序错误后，提示“按时间倒序排列”。
- 部署配置：通过观察 Actions 日志识别冲突，手动调整设置。
成本与效率：
- 总耗时：17分钟（模型） + 10分钟（人工调整）。
- 经济成本：约0.8美元，显著低于人工开发时间成本。

| 开发者行动指南

技能培养：
- Prompt Engineering：学习结构化提示设计（如 COSTAR 框架）。
- 代码审查：建立模型生成代码的审查清单（安全、性能、可维护性）。
工具链整合：
- IDE 插件：如 Cursor、GitHub Copilot，实现上下文感知的代码补全。
- 自动化测试：将模型生成代码纳入 CI/CD 流水线。
风险管理：
- 安全扫描：使用 Semgrep、Bandit 检查生成代码。
- 知识验证：对模型提供的技术建议进行二次确认（如官方文档比对）。

| 未来展望

Willison 指出，LLM 正在改变开发者的工作流范式：

原型设计：从小时级缩短至分钟级。
技术债务管理：自动生成文档、测试、迁移脚本。
跨领域协作：前端开发者能快速实现后端逻辑，反之亦然。

然而，开发者角色将更偏向于“技术策展人”——在 LLM 的辅助下，专注于架构设计、关键算法和系统优化，而非重复性编码。

通过掌握这些策略，开发者可将 LLM 转化为强大的生产力杠杆，在保持代码质量的同时，释放更多创新潜力。

原文地址：

https://simonwillison.net/2025/Mar/11/using-llms-for-code/

欢迎朋友们关注❤️和星标⭐️