深夜惊喜!谷歌版o1免费上线,支持图片和音频输入!还能在Cursor里用,支持代码批量修改!

大模型向量数据库机器学习

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

picture.image

昨天深夜,当大家都准备睡觉的时候,Google突然放了个大招。 他们悄悄上线了一个新模型,叫 Gemini 2.0 Flash Thinking 。这名字听起来可能有点拗口,但这就是谷歌版的o1!更让人兴奋的是,它现在已经可以集成到像 Cursor 这样的代码编辑器里直接使用了!

picture.image

可能有些朋友知道,我之前的文章写到 Gemini 2.0 Flash 也可以在 Cursor 的 chat 模式中使用,速度非常快。这对于一些头脑风暴或者不需要直接修改代码的场景非常有用。

picture.image

但这次更新更厉害的是,它可以使用 composer 模式了!这意味着它可以自动化进行多个代码修改,效率直接提升了一个档次。

picture.image

考虑到 Claude 模型的调用次数限制,以及 Gemini 2.0 Flash 完全免费且速度极快的特点,在很多非核心的代码修改场景下,它会是一个非常好的选择。

而且最重要的是,它 完!全!免!费!

让我们来看看这个模型有多强:

1、速度快得惊

• 复杂数学题秒出答案,完全不用等待,复杂数学题14秒就能解出,比其他模型快5倍

picture.image ▲ 14 秒内破解了 goto 数学题

2、推理能力超强

• 在LMSYS排行榜上横扫所有类别: 数学、编程、创意写作全部第一

picture.image

• 首个成功解决"三赌徒问题"的模型 有网友测试,Gemini 2.0 Flash Thinking 成为了首个正确解答该问题的模型,而他之前测试的 o1-preview、o1、r1、QwQ 模型都未能过关。

picture.image

三赌徒问题 :假设三个赌徒最初有 (a, b, c) 美元。每次试验都是随机选择两个玩家,让他们公平地掷一枚硬币;根据输赢,他们会正常地转手 1 美元。玩家一旦破产,就会退出。令 (S_1) 表示一名玩家破产所需的游戏局数。令 (S_2) 表示两名玩家破产所需的游戏局数。求 S_1 和 S_2 的期望。

这是模型的部分回答:

picture.image

picture.image

• 能解决最难高考数学题

有人把号称史上最难的高考数学题扔给Gemini 2.0 Flash Thinking,居然答对了(连o1都做不到)

picture.image

3、思维过程透明化

• 会展示完整的思考步骤

picture.image

• 像人类一样一步步推理

• 思维链条清晰可见

4、 多模态理解

• 支持图片和音频输入

picture.image

• 能看懂手写数学题 • 可以理解复杂图表 能够快速解答问题并展示思考过程,例如在Gemini解决了一个数学期望题,而 OpenAI 的 o1 则需要多花3.5倍的时间。

picture.image

Gemini 2.0 Flash Thinking 和 o1 一样,也采用「推理时计算」策略,投入更多计算能力以提升解决问题的能力。

它具备一定的自我纠错和变通能力,例如在解决台球数字题时,能够识别数字的不同朝向并调整解题思路。

这个模型的上下文窗口有32000 to kens,虽然不及某些百万级的模型,但是对于日常使用来说已经完全够用了。

最后,如果你想试用这个新模型,只需要:

  1. 打开Google AI Studio:https://aistudio.google.com/。

  2. 选择Gemini 2.0 Flash Thinking模型 或 创建API 。

picture.image

  1. 开始体验 免费、快速、强大的 Gemini 2.0!

最后说一句,看到谷歌这次的表现,我真的觉得AI的竞争要开始变得更有意思了...

往期推荐

从0到1用AI做了个AI服务网站, 全程没写一行代码。

当Claude3.5 遇上 Gemini 2,这个免费的AI编程竞技场炸了。

TEN Agent 一键让 Coze Bot 开口说话,这下AI助手终于能跟我聊天了。

我花了72小时研究Cursor Agents,以下是必须分享的硬核干货!

Cursor从入门到精通:不可错过的七大技巧分享,Agent、Cursorrules(详细教程)

🌟 知音难求,自我修 炼亦艰, 抓住前沿技术的机遇,与我们一起成为创新的超级个体 (把握AIGC时代的个人力量)。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论