Apple intelligence 最新演示&技术报告新鲜出炉!

技术

今天的热点的风头绝对是Apple Intelligence,盖过了咱们今天另外一篇推文介绍的Meta的Segment Anything。

首先是推迟了10月份iOS 18.1的正式发布,在MacOS Sequoia 、 iOS 18和iPadOS 18 上发布了开发者预览版,不包括 Siri 2.0,以及一份的47 页的论文,比他们 6 月的主题演讲更详细。

先看产品演示!

  1. 通知筛选,通过ai筛选出重要的通知,从此原理垃圾通知的干扰!picture.image
  2. 低功耗在任意应用中实现rewrite 改写

picture.image

  1. 写作工具,类似于常见的编辑场景的aipicture.image

论文地址:https://machinelearning.apple.com/papers/apple\_intelligence\_foundation\_language\_models.pdf

全文很长有47页。这里简单提一些,感兴趣的可以看原文~

  • data:最终 6.3T token 用于核心预训练,1T token具有更高的代码/数学混合比例用于继续预训练,以及 100B token用于上下文延长至 32k
  • Hardware:AFM 使用 v4 和 v5p Cloud TPU 进行训练,而不是 Apple Silicon!AFM server:8192 TPUv4,AFM-on-device:2048 TPUv5p
  • Post Training:虽然 Apple Intelligence 功能是通过base 模型之上的adapter提供支持的,但根据经验,发现改进通用训练后能提升所有功能的性能,因为模型在遵循指令、推理和写作方面具有更强的能力。
  • 与llama3一样,使用了大量的合成数据,包括数学,代码,工具,等等场景的合成数据,已经是一种主流做法!

公开了基准测试结果:拎出来跟llama3的评测对比一波。picture.image

很显然是明显弱于llama3的,但是请对apple的人工评估抱有幻想!如下图~

picture.image

PS:给公众号添加【星标⭐️】不迷路!您的点赞、在看、关注 是我坚持的最大动力!

欢迎多多关注公众号「NLP前沿」,加入交流群,交个朋友吧,一起学习,一起进步!

最新文章推荐阅读

RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
DevOps 在字节移动研发中的探索和实践
在日益复杂的APP工程架构下,如何保证APP能高效开发,保障团队效能和工程质量?本次将结合字节内部应用的事件案例,介绍DevOps团队对移动研发效能建设的探索和思考。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论