🍹 Insight Daily 🪺
Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。
昨天深夜,当大家都准备睡觉的时候,Google突然放了个大招。 他们悄悄上线了一个新模型,叫 Gemini 2.0 Flash Thinking 。这名字听起来可能有点拗口,但这就是谷歌版的o1!更让人兴奋的是,它现在已经可以集成到像 Cursor 这样的代码编辑器里直接使用了!
可能有些朋友知道,我之前的文章写到 Gemini 2.0 Flash 也可以在 Cursor 的 chat 模式中使用,速度非常快。这对于一些头脑风暴或者不需要直接修改代码的场景非常有用。
但这次更新更厉害的是,它可以使用 composer 模式了!这意味着它可以自动化进行多个代码修改,效率直接提升了一个档次。
考虑到 Claude 模型的调用次数限制,以及 Gemini 2.0 Flash 完全免费且速度极快的特点,在很多非核心的代码修改场景下,它会是一个非常好的选择。
而且最重要的是,它 完!全!免!费!
让我们来看看这个模型有多强:
1、速度快得惊
• 复杂数学题秒出答案,完全不用等待,复杂数学题14秒就能解出,比其他模型快5倍
▲ 14 秒内破解了 goto 数学题
2、推理能力超强
• 在LMSYS排行榜上横扫所有类别: 数学、编程、创意写作全部第一
• 首个成功解决"三赌徒问题"的模型 有网友测试,Gemini 2.0 Flash Thinking 成为了首个正确解答该问题的模型,而他之前测试的 o1-preview、o1、r1、QwQ 模型都未能过关。
三赌徒问题 :假设三个赌徒最初有 (a, b, c) 美元。每次试验都是随机选择两个玩家,让他们公平地掷一枚硬币;根据输赢,他们会正常地转手 1 美元。玩家一旦破产,就会退出。令 (S_1) 表示一名玩家破产所需的游戏局数。令 (S_2) 表示两名玩家破产所需的游戏局数。求 S_1 和 S_2 的期望。
这是模型的部分回答:
• 能解决最难高考数学题
有人把号称史上最难的高考数学题扔给Gemini 2.0 Flash Thinking,居然答对了(连o1都做不到)
3、思维过程透明化
• 会展示完整的思考步骤
• 像人类一样一步步推理
• 思维链条清晰可见
4、 多模态理解
• 支持图片和音频输入
• 能看懂手写数学题 • 可以理解复杂图表 能够快速解答问题并展示思考过程,例如在Gemini解决了一个数学期望题,而 OpenAI 的 o1 则需要多花3.5倍的时间。
Gemini 2.0 Flash Thinking 和 o1 一样,也采用「推理时计算」策略,投入更多计算能力以提升解决问题的能力。
它具备一定的自我纠错和变通能力,例如在解决台球数字题时,能够识别数字的不同朝向并调整解题思路。
这个模型的上下文窗口有32000 to kens,虽然不及某些百万级的模型,但是对于日常使用来说已经完全够用了。
最后,如果你想试用这个新模型,只需要:
-
打开Google AI Studio:https://aistudio.google.com/。
-
选择Gemini 2.0 Flash Thinking模型 或 创建API 。
- 开始体验 免费、快速、强大的 Gemini 2.0!
最后说一句,看到谷歌这次的表现,我真的觉得AI的竞争要开始变得更有意思了...
往期推荐
当Claude3.5 遇上 Gemini 2,这个免费的AI编程竞技场炸了。
TEN Agent 一键让 Coze Bot 开口说话,这下AI助手终于能跟我聊天了。
我花了72小时研究Cursor Agents,以下是必须分享的硬核干货!
Cursor从入门到精通:不可错过的七大技巧分享,Agent、Cursorrules(详细教程)
🌟 知音难求,自我修 炼亦艰, 抓住前沿技术的机遇,与我们一起成为创新的超级个体 (把握AIGC时代的个人力量)。