点击上方👆蓝字关注我们!
今天,豆包大模型 1.5 正式发布!
全新 Doubao-1.5-pro 模型综合能力显著增强,在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。
目前,豆包大模型 1.5 已全面上线火山方舟,邀你来测!
扫码即刻体验
效果领先,豆包大模型 1.5 超越 GPT-4o、Claude 3.5
豆包通用模型 pro(Doubao-1.5-pro)
本次更新,我们在多个公开评测基准上,对 Doubao-1.5-pro 的性能进行评估。Doubao-1.5-pro 在知识(MMLU_PRO、GPQA)、代码(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型。
备注:
- 其他模型的评测指标来自官方评测结果,官方评测结果中不含的部分来自内部评测平台结果
- GPT-4o-0806 在语言模型公开评测指标中显著优于 GPT-4o 其他版本 https://github.com/openai/simple-evals
豆包通用模型 lite(Doubao-1.5-lite)
Doubao-1.5-lite 在轻量版语言模型中也处于全球一流水平,在综合(MMLU_pro)、推理(BBH)、数学(MATH)、专业知识(GPQA)权威测评指标持平或超越 GPT-4omini,Cluade 3.5 Haiku。其模型效果甚至可以比肩 9 月份的 Doubao-pro-32k-0828,意味着客户在众多场景中,可以直接用 lite 模型成本,获得过去 pro 模型的效果。
豆包·视觉理解模型(Doubao-1.5-vison-pro)
相比上一版本,Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。
Doubao-1.5-vision-pro 在多个权威测评基准上取得全球领先表现:
备注:在评测中 GPT-4o-1120 在多模态能力上要优于 GPT-4o-0806
支持任意分辨率和极端长宽比图像识别
分辨率一直是影响视觉理解能力的重要因素,为了处理各种场景下的复杂图像输入,Doubao-1.5-vision-pro 采用了原生动态分辨率的架构设计,支持任意分辨率的图像输入。无论是高清大图还是低分辨率的小图,亦或是极端长宽比例的图像,模型都能实现精准的特征提取和高效的计算性能。
领先的复杂指令遵循能力
Doubao-1.5-vison-pro 通过系统性的原子能力拆解和多维度指令的逻辑组合,在后训练阶段引入了多样化的视觉指令数据,从而激发模型的指令遵循能力,从容应对需要遵循更复杂指令的场景。
豆包·实时语音模型 (Doubao-1.5-realtime-voice-pro)
本次推出了豆包·实时语音模型,并在豆包 APP 全量开放( 体验前,请将豆包 APP 请升级至 7.2.0 版本 )。
作为一款语音理解和生成一体化的模型,豆包实时语音大模型真正实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务,敬请期待。
高效模型结构,超低成本
豆包大模型 1.5 从预训练阶段就坚持训练-推理一体设计,在最强模型效果、卓越模型性能和最优推理成本之间取得平衡。
模型结构上,豆包大模型 1.5 采用大规模稀疏 MoE 架构,以较小的激活参数进行预训练,等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。
同时,字节跳动自研服务器集群方案灵活支持低成本芯片,硬件成本比行业方案大幅降低;自研网卡和网络协议,显著优化小包通讯效率;算子层计算和通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。
豆包大模型 1.5 在训练过程中,未使用任何其他模型生成的数据,扎实不走“捷径”。豆包大模型构建完全自主的数据生产体系,以标注团队与模型 self play 技术相结合,高效优化数据质量,提升数据标注多样性和难度,确保数据来源的独立性和可靠性。
详细了解,请参考: https://team.doubao.com/doubao\_1\_5\_pro
加量不加价,助力大模型应用加速爆发
效果、性能和最优推理成本之间的极致平衡,让豆包大模型在各行各业中被广泛使用,tokens 调用量不断日创新高。
豆包大模型 1.5 全产品,包括 doubao-1.5-pro,doubao-1.5-lite,doubao-1.5-vision-pro 等, 将继续保持原有模型价格不变,加量不加价。 火山引擎将一直坚持 AI 普惠,助力 AI 创新,让更多企业和开发者获得豆包大模型带来的帮助!