谷歌刚刚发布开源大语言模型 Gemma，对标LLAMA2，汇总大家关注的一些问题 - 文章 - 开发者社区

picture.image

就在 AI 圈子还在沉迷 Sora 的惊艳效果的时候，谷歌悄咪咪的宣布的大语言模型 Gemma，有一些关键信息值得我们关注。

Gemma 值得关注的信息

1、大家最关注的是开源模型大小，毕竟决定了是否能玩的起来

Gemma 发布了两个版本，2B(20 亿参数)和 7B(70 亿参数)的两个模型，在百家纵横的大模型里面，可以说已经非常轻量级别的了，官方声称能够支持各种工具和系统，同时能在开发者的笔记本电脑及工作站上顺畅运行。

2、是否可商用？答案是肯定的。

官方原话：Terms of use permit responsible commercial usage and distribution for all organizations, regardless of size.(使用条款允许所有组织（无论规模大小）负责任地进行商业使用和分发。)

3、Gemma 和之前的 Gemini 的关系？

Gemma 是一系列轻量级、最先进的开放式模型，采用与创建 Gemini 模型相同的研究和技术而构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发，其灵感来自 Gemini，其名称反映了拉丁语 gemma，意思是“宝石”。

4、最强开源大模型的位置现在易主了，那 Gemma 的效果怎么样？

官方回答是 Gemma 2B 和 7B 能够在同等参数大小模型面前实现最佳的性能，在关键基准上超越了更大的模型，同时遵守安全和输出的严格标准。

picture.image

5、哪里可以快速体验 Gemma？

现在可以直接在 HF 上面体验，模型选择 Gemma

🔗: https://huggingface.co/chat

picture.image

Perplexity Lab 也可以快速体验 Gemma。

🔗：https://labs.perplexity.ai/

picture.image

6、模型下载地址在哪里？

huggingface 下载地址：https://huggingface.co/collections/google/gemma-release-65d5efbccdbb8c4202ec078b

picture.image

Kaggle 下载地址: https://www.kaggle.com/models/google/gemma/frameworks/transformers

picture.image

7、硬件需求

Gemma 可以在 CPU、GPU 和 TPU 上运行。对于 GPU，建议在 GPU 上为 2B 的模型使用 8GB+ RAM，为 7B 的模型在 GPU 上使用 24GB+ RAM。

8、开源地址在哪里?

Google Gemma 模型的官方 PyTorch 实现: https://github.com/google/gemma\_pytorch

适用于 Google Gemma 模型的轻量级独立 C++ 推理引擎（nb 吧，推理都给你干出来了）: https://github.com/google/gemma.cpp

Google DeepMind 的开放权重地址：https://github.com/google-deepmind/gemma

9、另外开放免费额度，用于研究和开发?

Gemma 是为推动人工智能创新的开发人员和研究人员的开放社区而构建的，今天就可以开始与 Gemma 合作，使用 Kaggle 的免费访问权限、Colab 笔记本的免费套餐以及首次使用 Google Cloud 用户的 300 美元积分。研究人员还可以申请高达 50 万美元的 Google Cloud 积分来加速他们的项目。

picture.image

10、技术报告在哪里？

pdf 🔗：https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

picture.image

下载不了的后台回复 gemma 下载英文原版和中文版本。

11、了解更多信息

有关 Gemma 的更多信息并访问快速入门指南, 🔗 https://ai.google.dev/gemma?hl=zh-cn

Gemma：推出最先进的新开放模型

https://blog.google/technology/developers/gemma-open-models/

picture.image

在谷歌，我们相信让人工智能对每个人都有帮助。我们长期以来一直为开放社区贡献创新，例如 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold 和 AlphaCode。今天，我们很高兴推出 Google 的新一代开放模型，以帮助开发人员和研究人员负责任地构建人工智能。

Gemma open models

Gemma 是一系列轻量级、最先进的开放式模型，采用与创建 Gemini 模型相同的研究和技术而构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发，其灵感来自 Gemini，其名称反映了拉丁语 gemma，意思是“宝石”。除了我们的模型权重之外，我们还发布了工具来支持开发人员创新、促进协作并指导负责任地使用 Gemma 模型。

Gemma 从今天开始在全球发售。以下是需要了解的关键细节：

我们发布了两种尺寸的模型配重：Gemma 2B 和 Gemma 7B。每个尺寸都发布了经过预训练和指令调整的变体。
新的 Responsible Generative AI 工具包为使用 Gemma 创建更安全的 AI 应用程序提供了指导和基本工具。
我们通过原生 Keras 3.0 提供跨所有主要框架的推理和监督微调 (SFT) 工具链：JAX、PyTorch 和 TensorFlow。
即用型 Colab 和 Kaggle 笔记本，以及与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成，让您可以轻松开始使用 Gemma。
预先训练和指令调整的 Gemma 模型可以在您的笔记本电脑、工作站或 Google Cloud 上运行，并可轻松部署在 Vertex AI 和 Google Kubernetes Engine (GKE) 上。
跨多个 AI 硬件平台的优化可确保行业领先的性能，包括 NVIDIA GPU 和 Google Cloud TPU。
使用条款允许所有组织（无论规模大小）负责任地进行商业使用和分发。

State-of-the-art performance at size 尺寸方面最先进的性能

Gemma 模型与 Gemini 共享技术和基础设施组件，Gemini 是我们当今广泛使用的最大、功能最强大的 AI 模型。与其他开放式型号相比，这使得 Gemma 2B 和 7B 能够在其尺寸范围内实现同类最佳的性能。Gemma 模型能够直接在开发人员笔记本电脑或台式计算机上运行。值得注意的是，Gemma 在关键基准上超越了更大的模型，同时遵守我们安全和负责任的输出的严格标准。有关性能、数据集组成和建模方法的详细信息，请参阅技术报告

picture.image

Responsible by design 对设计负责

Gemma 的设计以我们的人工智能原则为核心。为了使 Gemma 预训练模型安全可靠，我们使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外，我们利用人类反馈 (RLHF) 进行广泛的微调和强化学习，使我们的指令调整模型与负责任的行为保持一致。为了了解和降低 Gemma 模型的风险状况，我们进行了稳健的评估，包括手动红队、自动对抗测试以及危险活动模型能力评估。我们的模型卡中概述了这些评估。1

我们还与 Gemma 一起发布了新的 Responsible Generative AI Toolkit，以帮助开发人员和研究人员优先构建安全且负责任的 AI 应用程序。该工具包包括：

安全分类：我们提供了一种新颖的方法，可以用最少的示例构建强大的安全分类器。
调试：模型调试工具可帮助您调查 Gemma 的行为并解决潜在问题。
指南：您可以根据 Google 在开发和部署大型语言模型方面的经验，获取模型构建者的最佳实践。

Optimized across frameworks, tools and hardware 跨框架、工具和硬件进行优化

您可以根据自己的数据微调 Gemma 模型，以适应特定的应用程序需求，例如摘要或检索增强生成 (RAG)。Gemma 支持多种工具和系统：

多框架工具：带上您最喜欢的框架，以及跨多框架 Keras 3.0、本机 PyTorch、JAX 和 Hugging Face Transformers 进行推理和微调的参考实现。
跨设备兼容性：Gemma 模型可以跨流行的设备类型运行，包括笔记本电脑、台式机、物联网、移动设备和云，从而实现广泛的 AI 功能。
尖端硬件平台：我们与 NVIDIA 合作，针对 NVIDIA GPU 优化 Gemma，从数据中心到云端再到本地 RTX AI PC，确保行业领先的性能并与尖端技术集成。
针对 Google Cloud 进行了优化：Vertex AI 提供了广泛的 MLOps 工具集，其中包含一系列调整选项以及使用内置推理优化的一键部署。完全托管的 Vertex AI 工具或自我管理的 GKE 提供高级自定义功能，包括从任一平台跨 GPU、TPU 和 CPU 部署到经济高效的基础设施。

Free credits for research and development 用于研究和开发的免费积分

Gemma 是为推动人工智能创新的开发人员和研究人员的开放社区而构建的。您今天就可以开始与 Gemma 合作，使用 Kaggle 的免费访问权限、Colab 笔记本的免费套餐以及首次使用 Google Cloud 用户的 300 美元积分。研究人员还可以申请高达 50 万美元的 Google Cloud 积分来加速他们的项目。

Getting started 入门

您可以在 ai.google.dev/gemma 上探索有关 Gemma 的更多信息并访问快速入门指南。

随着我们不断扩展 Gemma 型号系列，我们期待为不同的应用推出新的变体。请继续关注未来几周与 Gemma 联系、学习和构建的活动和机会。

我们很高兴看到您的创造！

AIGC 知识库，里面新增Sora专题，花了一些时间整理了目前网上可查到的sora资料，觉得ok的都整理到知识库了，应该算是比较全面。包括sora技术报告、大厂解读、sora官方视频合集和提示词、sora与ranway对比，大咖的一些观点，文档资料、博文介绍，后面持续更新了。https://szqxz4m7fs.feishu.cn/wiki/wikcnMJ5qdVdOJ03XsBZFuXIRkf

picture.image

我是大林，NLP 高级算法工程师，主要从事自然语言处理(NLP)、知识图谱、大模型领域的实际业务落地。持续关注 AIGC 趋势发展，和大家一起交流。加我微信(dalinvip2023)，备注【公众号 AIGC】，进 AIGC 交流群一起交流(还有Sora、数字人、绘画、技术、AI 变现多方向。)

如果文章对你有一点点🤏🏻帮助，关注公众号并星标，可以及时收到最新AI信息，点赞、在看、帮忙转发给更多的朋友，是最大的支持，谢谢。