开始前先卖个关子:朋友们知道 ai.com 这个 AI 时代看起来最贵的域名是谁的吗?其实我也不知道,它很神秘,又但会在不同时间指向最火的 AI 产品,而现在它指向了 DeepSeek -> 神秘的 AI.com,真的被 DeepSeek 买下来了?
话说回来,作为开发界看起来最贵的域名:ai.dev,朋友们知道现在它是谁家的吗?这个我知道,是财大气粗的 Google,它指向了 Google AI Studio!
Google AI Studio 好在哪?
在 LLM 用户体验方面,Google 有些偏科,它在开发者体验方面投入很多,而在用户体验方面发力较晚。
最早接触到 Google Deepmind 开发者体验,是前 OpenAI 开发者关系负责人 Logan 的加盟,后来全球最大开源模型社区 HuggingFace 的两位研究员也相继加入,Deepmind 开发者关系团队星光熠熠,几乎没有其他 AI 团队可以相比。
印象很深的一次,是 Logan 和著名独立开发者在 X(Twitter) 上就 Google AI Studio 的上手开发体验问题很客观的讨论。大型公司的产品往往都会有一个问题:上手很难、很多集团性的授权、认证和页面跳转等,对新手很不友好。在 Logan 的推动下,Google AI Studio 把新手上手门槛做了很大的优化,进入网站后直接 Google 登录就可以在单个页面内完成 API Key 申请、Playground 体验、复制 Python 代码到 Colab 运行等完整流程。
而在近期 Google Gemini 一系列全新能力的发布中,Google AI Studio 也都是首发位置,且都可以免费体验,没有付费门槛,咱们一起看看它都能做什么?
- Deepmind 全部模型可用
最全的 Deepmind 模型可体验,包括 Gemini、Gemma 和其他最新体验类模型。每个模型都有一个模型卡片,把上下文长度、输入输出 token 单价、用途推荐、实际案例、知识截止、限额和延迟等都很明确的说明。
另外调用过程还可以指定温度、Top P 等参数,以及标准化输出、方法调用、代码执行、Google 搜索等可选能力。
还有一个很实用的功能:模型结果对比。
对比两个不同模型在结果输出,调整参数后,选择在你的应用场景下更合适的模型和参数。
- 免费的 API Key 调用次数
免费版的 API 使用额度可以在这里查询:
https://ai.google.dev/gemini-api/docs/rate-limits
也可以在 Google AI Studio 个人账号下查询:
https://aistudio.google.com/plan\_information
- Stream Realtime
Gemini live 推出之时非常惊艳,通过实时录制屏幕和语音通话,实时得到 Gemini 的 AI 语音响应,指导网站操作的流程、甚至现实世界中的动作引导等。
这个官方示例也是后面很多实时音视频助手的标准做法,录屏后通过特定帧率传输图像和音频,连续理解用户意图和环境,做出有记忆的正确判断和输出。
- Starter Apps
Github - https://github.com/google-gemini/starter-applets
官方为开发者集成 Gemini 最新能力提供的示例应用,对场景的启发和新能力的实践都起到了很不错的打样的效果,目前提供了三个场景:
-
空间理解应用 - 展示 Gemini 的 2D 和 3D 空间实时理解与推理能力
-
视频分析 - 调用 Function Call 进行视频内容分析
-
地图探索 - 结合 Gemini 和 Google Map API 探索地图
- 开源教程类项目
Google Gen AI SDK
https://github.com/googleapis/python-genai
from google import genai
client = genai.Client(api_key="
YOUR_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash", contents="Explain how AI works in a few words"
)
print(response.text)
Gemini API Cookbook
https://github.com/google-gemini/cookbook
开发朋友们一定要关注这个 Cookbook,Google AI Studio 的能力都可以在这里找到对应的代码实现,更新也非常及时。
Open in Colab
还有一个很重要的功能是在 Colab 打开示例代码,它免去了自己创建 Colab 再粘贴代码的过程,而且预置了参数信息,开发验证非常便捷。
- Prompt Gallery
这个 Prompt 集合,汇集了很多实用场景下的提示词,如果你想找一些提示词灵感,或想通过提示词来测试对比模型推理结果,这里是一个很不错的集合地。
- 图像生成和精修编辑
选择下面这个模型,就可以体验图像生成和编辑能力了。
通过自然语言生成图像(和图像类模型的使用方法一样),再通过自然语言来局部微调、精修图像。
比如下面我们生成钢铁侠的图片后,让 Gemini 把战甲颜色变为橘色,看生成结果是遵循了我的要求的。
没想到这个开发者平台,做的效果比图像生成类产品更直接。。
Gemini 有什么独特优势?
Gemini 作为面向 C 端用户的应用,我自己觉得它相比 Google AI Studio 和其他 AI 助手的两个比较大的亮点:Deep Research 和 Canvas。
- Deep Research
Gemini Deep Research 的强大,依托于 Google 强大的搜索数据,这一点相信任何产品都是不能相比的。
它会先拟定一个研究计划,并得到我的许可后,开始执行研究。研究过程中,搜索到的参考网站非常全,一般会超过 100 个,且不会因为我输入了中文,而把 CSDN 等低质量网站纳入研究范围。在搜索数据源和数据源的质量判断上,Google 的能力还是非常值得信赖的。
几分钟的搜索和 Gemini 解读整理后,会输出一篇非常完整的研究报告,无论从格式上还是内容详实程度、信息可溯源的角度,质量都非常的高。
免费用户每个月都指定的使用次数,感兴趣的朋友可以试试,可以和 Grok-3、OpenAI 等 Deep Research/Search 作对比。
- Canvas
Canvas 能力本身并不新鲜,OpenAI Canvas 和 Claude Artifacts 都有类似的能力。
Gemini Canvas 可以生成并制定代码页面预览、可以生成文档、SVG 等内容,并支持通过自然语言来互动编辑。
欢迎朋友们关注❤️和星标⭐️
