迄今为止规模最大,能力最强的Google大模型Gemini它来了。
美国时间 12 月 6 日,谷歌 CEO 桑达尔・皮查伊官宣 Gemini 1.0 版正式上线。这次发布的 Gemini 大模型是原生多模态大模型,多模态的 Gemini 可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频。
为了与 OpenAI 和微软展开竞争,谷歌果断从 PaLM 2 切换到了 Gemini 上,甚至在今年 4 月份直接把谷歌大脑(Google Brain)和
DeepMind
合并在了一起,Gemini 就由新组成的 Google
DeepMind
汇合两个实验室的力量进行攻关。
看完发布会,深感AI的强大,AI终究会超越人类。
史上最强AI助教
根据Google 放出的测试成果显示,从自然图像、音频和视频理解到数学推理,Gemini的性能在 32 个大型语言模型学术基准测试中,超过了30个当前最先进的结果。在文本、常规推理、数学、代码等领域,Gemini 的表现几乎是全方位碾压了 OpenAI 的 GPT-4。
AI 带给人 们的不再只是智能软件,而是更有用、更直观的专家助手或助理。
“上知天文,下知地理”,轻松回答学生关于科学、历史、地理等各个领域的问题。
“你画我猜、你说我猜”一系列列游戏互动,让学生在游戏中收获知识、培养技能,真正实现了寓教于乐。
“看图写作,辅导作业”那更是不在话下,简单拿捏。
史上最强AI助教,谷歌的Gemini** 它来了。**
寓教于乐
1. 你画我猜
多模态-图像识别
随手画个鸭子,从曲线到鸭子成型,Gemini 可以精准识别。
2. 你说我猜
多模态-语音识别
根据提示猜国家,提示:这个国家是袋鼠、考拉的故乡,Gemini立马猜出澳大利亚。
3. 纸杯猜猜看
多模态-视频识别
猜猜纸球在哪个杯子下面,手速再快,也躲不过 Gemini 的眼睛。
4. 石头 剪刀布
多模态-视频识别
Gemini 很快说出,你正在玩石头剪刀布。
5. 手势猜猜看
多模态-视频识别
Gemini 带你一秒回到童年,感受童真的快乐。
实物教学
6. 实物识别
多模态-图像识别+文本生成
Gemini 帮你进行实物识别并分类,贴心的提示:柑橘比饼干更健康。
7. 创意毛线球
多模态-图像识别+AI绘图
拿到毛线球毫无头绪,别急,创意毛线球上线,Gemini 聪明的大脑帮你安排,可爱的兔子、美味的火龙果和蛋糕。
辅导教学
8. 辅导语文
多模态-图像识别+文本生成
看图写作,Gemini 帮你安排一场海滩音乐party。
9. 辅导数学
多模态-图像识别+数学推理
1年级数学,轻松搞定。Gemini 帮你快乐学习数字1-100。
10. 辅导物理
多模态-图像识别+强大知识库
初中物理不在话下,Gemini 设计更符合空气动力学的跑车。
11. 辅导地理
多模态-图像识别+强大知识库
上知天文,下知地理的Gemini ,排序太阳、地球、火星那不是分分钟。
12. 辅导美术
多模态-图像识别+艺术审美
选择困难症的我们,再也不用纠结选哪个,Gemini 帮你做出主意。