史上最强AI助教-Google大模型Gemini，它来了 - 文章 - 开发者社区

迄今为止规模最大，能力最强的Google大模型Gemini它来了。

picture.image

美国时间 12 月 6 日，谷歌 CEO 桑达尔・皮查伊官宣 Gemini 1.0 版正式上线。这次发布的 Gemini 大模型是原生多模态大模型，多模态的 Gemini 可以理解、操作和结合不同类型的信息，包括文本、代码、音频、图像和视频。

为了与 OpenAI 和微软展开竞争，谷歌果断从 PaLM 2 切换到了 Gemini 上，甚至在今年 4 月份直接把谷歌大脑（Google Brain）和

DeepMind

合并在了一起，Gemini 就由新组成的 Google

DeepMind

汇合两个实验室的力量进行攻关。

看完发布会，深感AI的强大，AI终究会超越人类。

史上最强AI助教

根据Google 放出的测试成果显示，从自然图像、音频和视频理解到数学推理，Gemini的性能在 32 个大型语言模型学术基准测试中，超过了30个当前最先进的结果。在文本、常规推理、数学、代码等领域，Gemini 的表现几乎是全方位碾压了 OpenAI 的 GPT-4。

AI 带给人们的不再只是智能软件，而是更有用、更直观的专家助手或助理。

“上知天文，下知地理”，轻松回答学生关于科学、历史、地理等各个领域的问题。

“你画我猜、你说我猜”一系列列游戏互动，让学生在游戏中收获知识、培养技能，真正实现了寓教于乐。

“看图写作，辅导作业”那更是不在话下，简单拿捏。

史上最强AI助教，谷歌的Gemini** 它来了。**

寓教于乐

1. 你画我猜

多模态-图像识别

picture.image

随手画个鸭子，从曲线到鸭子成型，Gemini 可以精准识别。

2. 你说我猜

多模态-语音识别

picture.image

‍根据提示猜国家，提示：这个国家是袋鼠、考拉的故乡，Gemini立马猜出澳大利亚。

3. 纸杯猜猜看

多模态-视频识别

picture.image

猜猜纸球在哪个杯子下面，手速再快，也躲不过 Gemini 的眼睛。

4. 石头剪刀布

多模态-视频识别

picture.image

Gemini 很快说出，你正在玩石头剪刀布。

5. 手势猜猜看

多模态-视频识别

picture.image

G‍emini 带你一秒回到童年，感受童真的快乐。

实物教学

6. 实物识别

多模态-图像识别+文本生成

picture.image

Gemini 帮你进行实物识别并分类，贴心的提示：柑橘比饼干更健康。

7. 创意毛线球

多模态-图像识别+AI绘图

picture.image

拿到毛线球毫无头绪，别急，创意毛线球上线，Gemini 聪明的大脑帮你安排，可爱的兔子、美味的火龙果和蛋糕。

辅导教学

8. 辅导语文

多模态-图像识别+文本生成

picture.image

看图写作，Gemini 帮你安排一场海滩音乐party。

9. 辅导数学

多模态-图像识别+数学推理

picture.image

1年级数学，轻松搞定。Gemini 帮你快乐学习数字1-100。

10. 辅导物理

多模态-图像识别+强大知识库

picture.image

初中物理不在话下，Gemini 设计更符合空气动力学的跑车。

11. 辅导地理

多模态-图像识别+强大知识库

picture.image

上知天文，下知地理的Gemini ，排序太阳、地球、火星那不是分分钟。

12. 辅导美术

多模态-图像识别+艺术审美

picture.image

选择困难症的我们，再也不用纠结选哪个，Gemini 帮你做出主意。