编码封神,Gemini 2.5 Pro (I/O 版)视频秒转 App!网友:比 o3/Claude 强,Vibe 程序员集结!

大模型向量数据库云安全

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

谷歌 I/O 大会前,Gemini 2.5 Pro 预览版先来一波升级,

一个 Pre‑I/O 更新,名称叫 gemini-2.5-pro-preview-05-06,直接替换了之前的 03-25 版本。

虽然擅长编码的模型通常在其他领域也会有泛化能力,但这次更新的重点是编码。

搞前端、做 UI 特别溜,能整出好看又好用的网页应用。并在功能强大、美观的 Web 应用程序构建的前端和 UI 开发方面表现出色。

WebDev Arena 第一名。 排名表现攀升 +147 Elo。该排行榜衡量人类对模型构建美观且功能强大的 Web 应用程序的能力的偏好。

picture.image

还能在 AI Studio 里,直接把视频内容变成能互动的学习 App。

看它如何变魔术:

Gemini 2.5 Pro
→ 观看 YouTube 教学视频
→ 解读语义与视觉要素
→ 输出完整 Web App

VideoMME 基准测试84.8%
意味着它能识别细节到位:
代码框架、按钮布局、交互逻辑,
全都拆解出来,
最终拼成一个可运行的学习工具。

并且根据我的体验,这个模型更新后比之前的老板本在推理速度上快了许多。

Gemini 2.5 Pro,前端不是难事。
不用翻设计稿、对着画布调参数,
它在 IDE 中一行提示,
就能生成视频播放器、表单、布局组件。

想像一下:
只要一句 “add video player”,
风格自动契合 Gemini 95 starter,
CSS、边距、边框,一并搞定。

Gemini App 那边也官宣了,说这个 I/O 版的 2.5 Pro 是他们最聪明的模型,写代码更牛。

Canvas 里,少量提示,即可生成交互式网页。

试试吧:
http://gemini.google.com/model/2-5-pro → 选 “Canvas”

某初级开发者评估平台 (junior-dev evals): “更新后的 Gemini 2.5 Pro 在我们的初级开发者评估中表现领先。它是第一个解决了我们一项涉及大型请求路由后端重构评估的模型。感觉更像一个资深开发者...”

picture.image

Replit Agent 的反馈:“我们发现 Gemini 2.5 Pro 是在‘能力与延迟比’方面最好的前沿模型。我期待在 Replit Agent 中推广它,用于那些对延迟敏感且需要高精度完成的任务...”

picture.image

Google AI Studio 的产品负责人 Logan Kilpatrick 还透露:

提前发布,不等 I/O: 团队太兴奋了,等不及到 I/O 大会,就提前把这个新模型放给大家用了。

Gemini-2.5-Pro-preview-05-06 不仅是最好的编码模型。它是所有事情的最佳模型。

picture.image

picture.image

  • 最优性价比2.50in/2.50 in / 15 out
  • 多项第一
    • MRCR 长文理解 93.0%
    • VideoMME 视频理解 84.8%
  • 稳健全能
    • Code Edit 76.5%/72.7%
    • Science & Math 83.0%

对标 GPT‑4.1、Claude、Grok、DeepSeek,
Gemini 2.5 Pro 做到了“价格低、表现高、功能全”。

而且需要注意的是,Gemini 2.5 Pro Preview 05-06 在所有需要很长上下文的场景中都优于 OpenAI 的 o3,因为 Gemini 可以做到长上下文,而 o3 不能。

全网实测

将自然图像转换为代码以表示独特图案:

通过一张叶子图像来编码这太疯狂了。

picture.image

有人用一个 Prompt 就搞出了 “最好看的太阳系” ,虽然一开始有点小 bug,但很快就修复了。

picture.image

有网友表示:“Gemini-2.5-Pro-preview-05-06 现在是我的首选编码模型。 它在我的几个硬提示中击败了 o3 和 Claude 3.7 Sonnet。 一个示例提示:“对来回摇晃的桶中的水进行代码模拟。了解它如何压碎 o3 和 Sonnet。 Google,叫它 Gemini 3!”

在Canvas编写了一个对芝加哥艺术学院的藏品进行展示的APP

有人搭了个 “实时人行道模拟” ,细节拉满——实时阴影、程序生成姓名职业,甚至人物实时心率都不放过。

还有视觉上非常不错的SVG图像。

picture.image

从手绘到app生成。

Gemini 2.5 Pro 预览版发布后的 Vibe 编码器。

picture.image

所以,此刻,Vibe编码程序员们高呼:“集结!”

picture.image

并且据透露。Visa公司正在招聘一名氛围编码程序员,我们看到了老朋友Bolt、Lovable、V0。

招聘网址:studio/https://www.visa.co.uk/en\_gb/jobs/REF061638W

picture.image

One More Thing

就在大家还在消化 Gemini 2.5 Pro (I/O 版) 的性能时,社区里已经开始扒起了模型的内部代号。

picture.image

有消息称,当前发布的 Gemini 2.5 Pro (包括那个 05-06 预览版) 内部代号是 "claybrook"

但有“内行”用户 (@legit_api 和 @MahawarYas27492) 表示,他们之前测试过的另一个代号为 "Nightwhisper" 的版本,表现 始终优于 "claybrook"

更强版本雪藏中? 很多用户开始期待 Google 能在 I/O 大会或其他什么时候,放出这个传说中更牛的 "Nightwhisper" 版本,管它是叫 2.5 Ultra 还是 Gemini Code

最后,做个小投票,你在使用AI Studio的时候是否偶尔会出现这种情况:

在Token比较长时,接下来无论如何都无法继续对话了。一直报错,但一段时间后又好了。虽然这个bug频率并不高。

picture.image

AI 绘画元方法:不肝提示词,文章直出封面。(端到端篇)

AI 绘画“元方法”分享,免费绘图流,掌握思维比提示词更重要。(融图篇)

本号知识星球(汇集ALL订阅频道合集和其他):

picture.image

星球里可获取更多AI实践和资讯:

picture.image

本号连载过许多MCP的文章,从概念到实践再到自己构建:

MCP是什么:Windsurf Wave3:MCP协议让AI直接读取控制台错误,自动化网页调试不用复制粘贴了!Tab智能跳转、Turbo模式。

Cline的MCP商店来了。

MCP怎么配置、报错解决:Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。

picture.image

MCP实践:Cursor + MCP:效率狂飙!一键克隆网站、自动调试错误,社区:每个人都在谈论MCP!

最新MCP托管平台:让Cursor秒变数据库专家,一键对接Github,开发效率暴增!

Blender + MCP 从入门到实践:安装、配置、插件、渲染与快捷键一文搞定!

比Playwright更高效!BrowserTools MCP 让Cursor直接控制当前浏览器,AI调试+SEO审计效率狂飙!

手把手教你配置BrowserTools MCP,Windows 和 Mac全流程,关键命令别忽略。

2分钟构建自己的MCP服务器,从算数到 Firecrawl MCP(手动挡 + AI档)

太简单了!Cline官方定义MCP开发流程,聊天式开发,让MCP搭建不再复杂。

🌟 知音难求,自我修 炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。

点这里👇关注我,记得标星哦~

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论