微软开源Phi-4系列模型!这次除了文本,还有多模态!

大模型向量数据库机器学习

话不多说,线上链接!!

文本模型: https://huggingface.co/microsoft/phi-4 https://huggingface.co/microsoft/Phi-4-mini-instruct

多模态模型: https://huggingface.co/microsoft/Phi-4-multimodal-instruct

Phi-4依旧继承Phi系列的宗旨,将网络筛选数据和合成数据发挥到极致,其中Phi-4参数量为14B,利用9.8T Tokens进行训练,1920块GPU训练了21天,指标效果见图2。

Phi-4-mini的参数量为3.8B,Phi-4-multimodal参数量为5.8B,多模态模型可以处理文本、图像和音频输入,生成文本输出,其中文本和语音包含多种语言,包括中文、英文、日语等,视频仅支持英文。

最后,NLP工作站 4群 成立啦!欢迎加群交流!

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论