🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
谷歌 I/O 大会前,Gemini 2.5 Pro 预览版先来一波升级,
一个 Pre‑I/O 更新,名称叫 gemini-2.5-pro-preview-05-06,直接替换了之前的 03-25 版本。
虽然擅长编码的模型通常在其他领域也会有泛化能力,但这次更新的重点是编码。
搞前端、做 UI 特别溜,能整出好看又好用的网页应用。并在功能强大、美观的 Web 应用程序构建的前端和 UI 开发方面表现出色。
WebDev Arena 第一名。 排名表现攀升 +147 Elo。该排行榜衡量人类对模型构建美观且功能强大的 Web 应用程序的能力的偏好。
还能在 AI Studio 里,直接把视频内容变成能互动的学习 App。
看它如何变魔术:
Gemini 2.5 Pro
→ 观看 YouTube 教学视频
→ 解读语义与视觉要素
→ 输出完整 Web App
VideoMME 基准测试84.8%
意味着它能识别细节到位:
代码框架、按钮布局、交互逻辑,
全都拆解出来,
最终拼成一个可运行的学习工具。
并且根据我的体验,这个模型更新后比之前的老板本在推理速度上快了许多。
Gemini 2.5 Pro,前端不是难事。
不用翻设计稿、对着画布调参数,
它在 IDE 中一行提示,
就能生成视频播放器、表单、布局组件。
想像一下:
只要一句 “add video player”,
风格自动契合 Gemini 95 starter,
CSS、边距、边框,一并搞定。
Gemini App 那边也官宣了,说这个 I/O 版的 2.5 Pro 是他们最聪明的模型,写代码更牛。
Canvas 里,少量提示,即可生成交互式网页。
试试吧:
http://gemini.google.com/model/2-5-pro → 选 “Canvas”
某初级开发者评估平台 (junior-dev evals): “更新后的 Gemini 2.5 Pro 在我们的初级开发者评估中表现领先。它是第一个解决了我们一项涉及大型请求路由后端重构评估的模型。感觉更像一个资深开发者...”
Replit Agent 的反馈:“我们发现 Gemini 2.5 Pro 是在‘能力与延迟比’方面最好的前沿模型。我期待在 Replit Agent 中推广它,用于那些对延迟敏感且需要高精度完成的任务...”
Google AI Studio 的产品负责人 Logan Kilpatrick 还透露:
提前发布,不等 I/O: 团队太兴奋了,等不及到 I/O 大会,就提前把这个新模型放给大家用了。
Gemini-2.5-Pro-preview-05-06 不仅是最好的编码模型。它是所有事情的最佳模型。
- 最优性价比 :15 out
- 多项第一 :
• MRCR 长文理解 93.0%
• VideoMME 视频理解 84.8% - 稳健全能 :
• Code Edit 76.5%/72.7%
• Science & Math 83.0%
对标 GPT‑4.1、Claude、Grok、DeepSeek,
Gemini 2.5 Pro 做到了“价格低、表现高、功能全”。
而且需要注意的是,Gemini 2.5 Pro Preview 05-06 在所有需要很长上下文的场景中都优于 OpenAI 的 o3,因为 Gemini 可以做到长上下文,而 o3 不能。
将自然图像转换为代码以表示独特图案:
通过一张叶子图像来编码这太疯狂了。
有人用一个 Prompt 就搞出了 “最好看的太阳系” ,虽然一开始有点小 bug,但很快就修复了。
有网友表示:“Gemini-2.5-Pro-preview-05-06 现在是我的首选编码模型。 它在我的几个硬提示中击败了 o3 和 Claude 3.7 Sonnet。 一个示例提示:“对来回摇晃的桶中的水进行代码模拟。了解它如何压碎 o3 和 Sonnet。 Google,叫它 Gemini 3!”
在Canvas编写了一个对芝加哥艺术学院的藏品进行展示的APP
有人搭了个 “实时人行道模拟” ,细节拉满——实时阴影、程序生成姓名职业,甚至人物实时心率都不放过。
还有视觉上非常不错的SVG图像。
从手绘到app生成。
Gemini 2.5 Pro 预览版发布后的 Vibe 编码器。
所以,此刻,Vibe编码程序员们高呼:“集结!”
并且据透露。Visa公司正在招聘一名氛围编码程序员,我们看到了老朋友Bolt、Lovable、V0。
招聘网址:studio/https://www.visa.co.uk/en\_gb/jobs/REF061638W
One More Thing
就在大家还在消化 Gemini 2.5 Pro (I/O 版) 的性能时,社区里已经开始扒起了模型的内部代号。
有消息称,当前发布的 Gemini 2.5 Pro (包括那个 05-06 预览版) 内部代号是 "claybrook" 。
但有“内行”用户 (@legit_api 和 @MahawarYas27492) 表示,他们之前测试过的另一个代号为 "Nightwhisper" 的版本,表现 始终优于 "claybrook" 。
更强版本雪藏中? 很多用户开始期待 Google 能在 I/O 大会或其他什么时候,放出这个传说中更牛的 "Nightwhisper" 版本,管它是叫 2.5 Ultra 还是 Gemini Code
最后,做个小投票,你在使用AI Studio的时候是否偶尔会出现这种情况:
在Token比较长时,接下来无论如何都无法继续对话了。一直报错,但一段时间后又好了。虽然这个bug频率并不高。
AI 绘画“元方法”分享,免费绘图流,掌握思维比提示词更重要。(融图篇)
本号知识星球(汇集ALL订阅频道合集和其他):
星球里可获取更多AI实践和资讯:
本号连载过许多MCP的文章,从概念到实践再到自己构建:
MCP是什么:Windsurf Wave3:MCP协议让AI直接读取控制台错误,自动化网页调试不用复制粘贴了!Tab智能跳转、Turbo模式。
MCP怎么配置、报错解决:Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。
MCP实践:Cursor + MCP:效率狂飙!一键克隆网站、自动调试错误,社区:每个人都在谈论MCP!
最新MCP托管平台:让Cursor秒变数据库专家,一键对接Github,开发效率暴增!
Blender + MCP 从入门到实践:安装、配置、插件、渲染与快捷键一文搞定!
比Playwright更高效!BrowserTools MCP 让Cursor直接控制当前浏览器,AI调试+SEO审计效率狂飙!
手把手教你配置BrowserTools MCP,Windows 和 Mac全流程,关键命令别忽略。
2分钟构建自己的MCP服务器,从算数到 Firecrawl MCP(手动挡 + AI档)
太简单了!Cline官方定义MCP开发流程,聊天式开发,让MCP搭建不再复杂。
🌟 知音难求,自我修 炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
点这里👇关注我,记得标星哦~