豆包大模型 1.5 正式发布，全面上线火山方舟 - 文章 - 开发者社区

点击上方👆蓝字关注我们！

picture.image

今天，豆包大模型 1.5 正式发布！

全新 Doubao-1.5-pro 模型综合能力显著增强，在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型，模型效果达到全球领先水平。

目前，豆包大模型 1.5 已全面上线火山方舟，邀你来测！

picture.image

扫码即刻体验

效果领先，豆包大模型 1.5 超越 GPT-4o、Claude 3.5

豆包通用模型 pro（Doubao-1.5-pro）

本次更新，我们在多个公开评测基准上，对 Doubao-1.5-pro 的性能进行评估。Doubao-1.5-pro 在知识（MMLU_PRO、GPQA）、代码（McEval、FullStackBench）、推理（DROP）、中文（CMMLU、C-Eval）权威测评基准上获得最佳成绩，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型。

picture.image

备注：

其他模型的评测指标来自官方评测结果，官方评测结果中不含的部分来自内部评测平台结果
GPT-4o-0806 在语言模型公开评测指标中显著优于 GPT-4o 其他版本 https://github.com/openai/simple-evals

豆包通用模型 lite（Doubao-1.5-lite）

Doubao-1.5-lite 在轻量版语言模型中也处于全球一流水平，在综合（MMLU_pro）、推理（BBH）、数学（MATH）、专业知识（GPQA）权威测评指标持平或超越 GPT-4omini，Cluade 3.5 Haiku。其模型效果甚至可以比肩 9 月份的 Doubao-pro-32k-0828，意味着客户在众多场景中，可以直接用 lite 模型成本，获得过去 pro 模型的效果。

picture.image

豆包·视觉理解模型（Doubao-1.5-vison-pro）

相比上一版本，Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级，进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力，并让模型的回复模式变得更加精简、友好。

Doubao-1.5-vision-pro 在多个权威测评基准上取得全球领先表现：

picture.image

备注：在评测中 GPT-4o-1120 在多模态能力上要优于 GPT-4o-0806

支持任意分辨率和极端长宽比图像识别

分辨率一直是影响视觉理解能力的重要因素，为了处理各种场景下的复杂图像输入，Doubao-1.5-vision-pro 采用了原生动态分辨率的架构设计，支持任意分辨率的图像输入。无论是高清大图还是低分辨率的小图，亦或是极端长宽比例的图像，模型都能实现精准的特征提取和高效的计算性能。

领先的复杂指令遵循能力

Doubao-1.5-vison-pro 通过系统性的原子能力拆解和多维度指令的逻辑组合，在后训练阶段引入了多样化的视觉指令数据，从而激发模型的指令遵循能力，从容应对需要遵循更复杂指令的场景。

豆包·实时语音模型（Doubao-1.5-realtime-voice-pro）

本次推出了豆包·实时语音模型，并在豆包 APP 全量开放（体验前，请将豆包 APP 请升级至 7.2.0 版本）。

作为一款语音理解和生成一体化的模型，豆包实时语音大模型真正实现了端到端语音对话。相比传统级联模式，在语音表现力、控制力、情绪承接方面表现惊艳，并具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务，敬请期待。

高效模型结构，超低成本

豆包大模型 1.5 从预训练阶段就坚持训练-推理一体设计，在最强模型效果、卓越模型性能和最优推理成本之间取得平衡。

模型结构上，豆包大模型 1.5 采用大规模稀疏 MoE 架构，以较小的激活参数进行预训练，等效 7 倍激活参数的 Dense 模型性能，远超业内 MoE 架构约 3 倍杠杆的常规效率。

同时，字节跳动自研服务器集群方案灵活支持低成本芯片，硬件成本比行业方案大幅降低；自研网卡和网络协议，显著优化小包通讯效率；算子层计算和通信的高效交叠，保证了多机分布式推理的稳定和高效；通过精细量化和 PD 分离等方案，灵活使用算力和多任务混合调度，实现更高效算力利用。

豆包大模型 1.5 在训练过程中，未使用任何其他模型生成的数据，扎实不走“捷径”。豆包大模型构建完全自主的数据生产体系，以标注团队与模型 self play 技术相结合，高效优化数据质量，提升数据标注多样性和难度，确保数据来源的独立性和可靠性。

详细了解，请参考： https://team.doubao.com/doubao\_1\_5\_pro

加量不加价，助力大模型应用加速爆发

效果、性能和最优推理成本之间的极致平衡，让豆包大模型在各行各业中被广泛使用，tokens 调用量不断日创新高。

豆包大模型 1.5 全产品，包括 doubao-1.5-pro，doubao-1.5-lite，doubao-1.5-vision-pro 等， 将继续保持原有模型价格不变，加量不加价。 火山引擎将一直坚持 AI 普惠，助力 AI 创新，让更多企业和开发者获得豆包大模型带来的帮助！

picture.image