Apple intelligence 最新演示&技术报告新鲜出炉！ - 文章 - 开发者社区

今天的热点的风头绝对是Apple Intelligence，盖过了咱们今天另外一篇推文介绍的Meta的Segment Anything。

首先是推迟了10月份iOS 18.1的正式发布，在MacOS Sequoia 、 iOS 18和iPadOS 18 上发布了开发者预览版，不包括 Siri 2.0，以及一份的47 页的论文，比他们 6 月的主题演讲更详细。

先看产品演示！

picture.image

全文很长有47页。这里简单提一些，感兴趣的可以看原文~

data：最终 6.3T token 用于核心预训练，1T token具有更高的代码/数学混合比例用于继续预训练，以及 100B token用于上下文延长至 32k
Hardware：AFM 使用 v4 和 v5p Cloud TPU 进行训练，而不是 Apple Silicon！AFM server：8192 TPUv4，AFM-on-device：2048 TPUv5p
Post Training：虽然 Apple Intelligence 功能是通过base 模型之上的adapter提供支持的，但根据经验，发现改进通用训练后能提升所有功能的性能，因为模型在遵循指令、推理和写作方面具有更强的能力。
与llama3一样，使用了大量的合成数据，包括数学，代码，工具，等等场景的合成数据，已经是一种主流做法！

公开了基准测试结果：拎出来跟llama3的评测对比一波。 picture.image

很显然是明显弱于llama3的，但是请对apple的人工评估抱有幻想！如下图~

picture.image

PS：给公众号添加【星标⭐️】不迷路！您的点赞、在看、关注 是我坚持的最大动力！

欢迎多多关注公众号「NLP前沿」，加入交流群，交个朋友吧，一起学习，一起进步！