最近,我一直在搞一个新项目:用 n8n 搭建一个全自动的视频生成工作流。
整个流程利用 Minimax 的 AI 能力,可以自动完成文本到语音(TTS)、生成图片、再将图片和音频合成为一个个独立的视频分镜。
技术上听起来很酷,但整个工作流却卡在了“最后一公里”。
每当 AI 生成了所有的视频片段、图片和音轨后,我都必须手动把这些素材导入到剪映里,一点点地对齐、拼接、剪辑、添加字幕和背景音乐。这个过程不仅枯燥,还极其耗时,完全违背了我追求“自动化”的初衷。
剪映手工合成,非常烦躁。尤其是画面、音频和字幕,一点一点扣对齐。
于是我下定决心:我要自己写一个视频合成的 API 服务,彻底干掉这个手动环节。
正好,我手头有两个当红的 AI 编程工具:我的老朋友 Cursor,以及新晋挑战者 Kiro。这成了一个绝佳的机会,让我可以在一个真实的、有一定复杂度的项目上,对两种截然不同的 AI 编程范式进行一次硬碰硬的对决。
Round 1:与 Cursor 的高效“结对编程”
按照惯例,我首先求助于已经订阅的 Cursor。我和它结对,生成修改反复循环,完成了一份详尽的需求文档,把视频拼接、画中画、添加字幕、异步任务管理等功能都定义得清清楚楚。
然后,我与 Cursor 的“结对编程”开始了:
-
我 :打开 Cursor,@ 相关文件,然后发出第一个指令:“帮我用 Python 和 FFmpeg 写一个基础的视频拼接函数。”
-
Cursor :秒速生成代码,质量很高。
-
我 :不错。现在,“为这个函数写一个单元测试,要覆盖分辨率不同的情况。”
-
Cursor :再次秒速完成。
-
我 :运行测试,发现一个 bug。于是我复制错误日志,再次向 Cursor 求助:“测试失败了,看看这个报错,帮我修复一下。”
这个过程循环往复。Cursor 就像一个顶级副驾驶,反应奇快,知识渊博。在它的帮助下,我的开发效率无疑是翻倍的。但问题的关键在于,我依然是那个手握方向盘的驾驶员 。我需要不断地分解任务、下达指令、检查结果、修正方向。我依然深度参与在“如何实现”的每一个细节里。
Round 2:Kiro 带来的“范式转移”
轮到 Kiro 上场时,我决定换一种玩法。我没有写一行代码,而是直接描述了我的需求。
接下来发生的事情,彻底刷新了我的认知:
- 它成了项目经理 :Kiro 阅读并理解了我的整份文档,然后输出了一份完整的需求文档、技术方案和任务列表。它建议了技术栈,规划了 API 接口,并把我的每一个“验收标准”都变成了一个可执行、可测试的任务。
1-需求文档(自动生成)
2-设计文档(自动生成)
3-任务清单(自动生成)
- 它开始自己“工作” :我点击开始后,Kiro 就像一个被分配了任务的远程同事,开始自己埋头写代码。
- 最关键的时刻 :在它的工作日志中,我看到了最让我震惊的一幕——它为某个功能写的测试失败了。但它没有停下来向我报告,而是停顿了片刻,似乎在“思考”,然后它修改了自己刚才写的代码,并重新运行了测试。这一次,测试通过了!
这个“自我修正”的闭环,使我意识到,我需要的不是一个更快的打字员,而是一个能理解我的目标、并独立完成任务的“工程师”。我想要的是委托任务,而不是下达指令。
大概花了几天时间,我完成了整套视频处理服务的 API 化。
我的选择
这次对比的结果是立竿见影的。Kiro 所代表的“自主工程师”范式,正是我解决当前项目瓶颈所需要的。它让我可以从繁琐的编码和调试中抽身,专注于更高层次的需求定义和最终成果的审查。
所以,我做出了一个决定:我取消了 Cursor 的订阅。
目前,Kiro 还处在免费试用期,但它展现出的能力已经完全说服了我。如果未来公布的价格合理,我会毫不犹豫地为这个能让我从“程序员”变为“项目导演”的新范式付费。
这不仅是为了效率,更是为了一种更具创造力和掌控感的未来。
Kiro 地址:https://kiro.dev/
