豆包大模型 1.5 正式发布,全面上线火山方舟

大模型火山方舟向量数据库

点击上方👆蓝字关注我们!

picture.image

今天,豆包大模型 1.5 正式发布!

全新 Doubao-1.5-pro 模型综合能力显著增强,在知识、代码、推理、中文等多个权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型,模型效果达到全球领先水平。

目前,豆包大模型 1.5 已全面上线火山方舟,邀你来测!

picture.image

picture.image

扫码即刻体验

效果领先,豆包大模型 1.5 超越 GPT-4o、Claude 3.5

豆包通用模型 pro(Doubao-1.5-pro)

本次更新,我们在多个公开评测基准上,对 Doubao-1.5-pro 的性能进行评估。Doubao-1.5-pro 在知识(MMLU_PRO、GPQA)、代码(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)权威测评基准上获得最佳成绩,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等业界一流模型。

picture.image

备注:

  • 其他模型的评测指标来自官方评测结果,官方评测结果中不含的部分来自内部评测平台结果
  • GPT-4o-0806 在语言模型公开评测指标中显著优于 GPT-4o 其他版本 https://github.com/openai/simple-evals

豆包通用模型 lite(Doubao-1.5-lite)

Doubao-1.5-lite 在轻量版语言模型中也处于全球一流水平,在综合(MMLU_pro)、推理(BBH)、数学(MATH)、专业知识(GPQA)权威测评指标持平或超越 GPT-4omini,Cluade 3.5 Haiku。其模型效果甚至可以比肩 9 月份的 Doubao-pro-32k-0828,意味着客户在众多场景中,可以直接用 lite 模型成本,获得过去 pro 模型的效果。

picture.image

豆包·视觉理解模型(Doubao-1.5-vison-pro)

相比上一版本,Doubao-1.5-vision-pro 在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术升级,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循方面的能力,并让模型的回复模式变得更加精简、友好。

Doubao-1.5-vision-pro 在多个权威测评基准上取得全球领先表现:

picture.image

备注:在评测中 GPT-4o-1120 在多模态能力上要优于 GPT-4o-0806

支持任意分辨率和极端长宽比图像识别

分辨率一直是影响视觉理解能力的重要因素,为了处理各种场景下的复杂图像输入,Doubao-1.5-vision-pro 采用了原生动态分辨率的架构设计,支持任意分辨率的图像输入。无论是高清大图还是低分辨率的小图,亦或是极端长宽比例的图像,模型都能实现精准的特征提取和高效的计算性能。

领先的复杂指令遵循能力

Doubao-1.5-vison-pro 通过系统性的原子能力拆解和多维度指令的逻辑组合,在后训练阶段引入了多样化的视觉指令数据,从而激发模型的指令遵循能力,从容应对需要遵循更复杂指令的场景。

豆包·实时语音模型 (Doubao-1.5-realtime-voice-pro)

本次推出了豆包·实时语音模型,并在豆包 APP 全量开放( 体验前,请将豆包 APP 请升级至 7.2.0 版本 )。

作为一款语音理解和生成一体化的模型,豆包实时语音大模型真正实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。火山引擎将在上半年通过方舟平台推出对应 API 服务,敬请期待。

高效模型结构,超低成本

豆包大模型 1.5 从预训练阶段就坚持训练-推理一体设计,在最强模型效果、卓越模型性能和最优推理成本之间取得平衡。

模型结构上,豆包大模型 1.5 采用大规模稀疏 MoE 架构,以较小的激活参数进行预训练,等效 7 倍激活参数的 Dense 模型性能,远超业内 MoE 架构约 3 倍杠杆的常规效率。

同时,字节跳动自研服务器集群方案灵活支持低成本芯片,硬件成本比行业方案大幅降低;自研网卡和网络协议,显著优化小包通讯效率;算子层计算和通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和 PD 分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。

豆包大模型 1.5 在训练过程中,未使用任何其他模型生成的数据,扎实不走“捷径”。豆包大模型构建完全自主的数据生产体系,以标注团队与模型 self play 技术相结合,高效优化数据质量,提升数据标注多样性和难度,确保数据来源的独立性和可靠性。

详细了解,请参考: https://team.doubao.com/doubao\_1\_5\_pro

加量不加价,助力大模型应用加速爆发

效果、性能和最优推理成本之间的极致平衡,让豆包大模型在各行各业中被广泛使用,tokens 调用量不断日创新高。

豆包大模型 1.5 全产品,包括 doubao-1.5-pro,doubao-1.5-lite,doubao-1.5-vision-pro 等, 将继续保持原有模型价格不变,加量不加价。 火山引擎将一直坚持 AI 普惠,助力 AI 创新,让更多企业和开发者获得豆包大模型带来的帮助!

picture.image

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
VikingDB:大规模云原生向量数据库的前沿实践与应用
本次演讲将重点介绍 VikingDB 解决各类应用中极限性能、规模、精度问题上的探索实践,并通过落地的案例向听众介绍如何在多模态信息检索、RAG 与知识库等领域进行合理的技术选型和规划。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论