今天在媒体上刷屏的是AI程序员Devin。在看了放出来的视频后,还是比较震撼的,自动化程度高,且能自我纠错和自主规划,模拟人类进行代码开发。
这是世界上第一位名为 Devin 的 AI 软件工程师可以编写、调试和部署代码来创建功能正常的网站和产品。
Devin 是一种新模型,可以在 Upwork 上完成工作,通过顶级 AI 公司的面试,并在 SWE-Bench 编码基准测试中表现出色。它的创造者说,它的编码性能远远超过了 GPT-4 和 Gemini LLMs 等现有的最先进的技术。
Devin只需要一个提示就可以开始使用——用户可以要求它建立一个网站或一个软件程序。然后,Devin 提出了一个系统地实施软件的计划,并逐一处理每个部分。为了帮助它运行,Devin 有自己的命令行、自己的代码编辑器,甚至有自己的浏览器。收到提示后,Devin 开始工作,创建文件和编写代码。
它也会调试自己的代码——在演示中,Devin 在遇到错误时会自动添加 print 语句,然后继续解决问题。早期用户报告说能够在 5-10 分钟内构建整个网站和简单的游戏。
总结一下:
- Devin 是 AI 软件工程师的先驱,他正在重新定义编码和软件开发的可能性。
- 除了通过编码基准测试之外,Devin 还通过自主规划、编码、调试和部署项目来展示现实世界的能力。
- Devin 配备了自己的命令行、代码编辑器和 Web 浏览器,可以从头到尾处理复杂的软件工程任务。
- 一个出色的演示包括 Devin 对 API 提供商进行基准测试,通过自我引导调试克服意外错误,以及部署一个完全样式化的网站。
- Cognition AI 邀请技术社区见证软件工程的未来,并探索 Devin 在现实世界中完成任务的能力。
AI程序员Devin背后的公司Cognition也备受关注,也是一家人少但含金量非常高的公司。
Devin刷屏背后,引发了交流群里比较激烈的讨论,尤其是程序员同学们。同时,Devin的发布,也让大家更确定未来的发展方向,人工智能自动化,即AGI。
用Claude3 Opus做奥数题,你猜怎么着?免费体验地址公布
既然看到这里了,如果觉得不错,请订阅公众号,然后点个赞、在看、转发。