12月18日,2025火山引擎Force原动力大会·冬在上海举办,在当天下午的Data +AI论坛上,火山引擎数智平台提出企业数智化从“数据驱动”迈向“认知驱动”新阶段,并提出了企业需要通过由多模态数据湖、数据智能体服务和高质量数据集组成的「Data+AI」方案服务,打造“企业认知引擎”的理念。
站在 AI 驱动产业变革的浪潮中,多模态非结构化数据的爆发式增长,与大模型、生成式 AI 应用的加速渗透,共同重塑了企业的业务逻辑。
在这场由数据、Token 和 AI Agent 共同激发的变革中,企业竞争力的核心正发生深刻演变:从传统的“数据驱动”转向更高维度的“认知驱动”。
而转变的关键,在于企业对非结构化数据的管理与应用能力。
如果说“数据驱动”侧重于利用结构化数据进行分析和决策,那么“认知驱动”则要求企业能从海量的、多模态的信息中提炼、加工并形成独特的“认知”。未来,企业级认知的数量与质量,将直接决定其核心竞争力。
这种转变意味着企业需要构建全新的能力栈,其核心要素包括:
-
统一的多模态数据与知识体系:将分散在各处的多模态数据和隐性的知识,整合成统一、可用的资产。
-
高质量数据集与垂类模型:这是大模型技术能否在行业深度扎根的关键,决定了 AI 应用的精准度和有效性。
-
企业级智能体服务:未来的软件生态将被 AI Agent 重塑,它们将成为连接数据、模型与业务场景的核心枢纽。
战略变革与能力重构:
构建“企业认知引擎”
「企业认知引擎」是火山引擎数智平台首次提出的「Data+AI」理念,其中包含了多模态数据湖、数据智能体服务和高质量数据集在内的多款解决方案,旨在通过 Data+AI 的深度融合,为企业在认知时代提供全新的增长动力。
如果将「企业认知引擎」比作一架精密的“飞行器”,那么它的使命就是帮助企业在复杂的数据迷雾中精准导航,最终实现从依赖经验决策到由认知驱动增长的“飞行模式”切换。
火山引擎**数智平台解决方案总经理萧然
发布「企业认知引擎」
这架“飞行器”由三个核心组件构成,各司其职,紧密协同:
1. 高质量数据集 :如同飞行器的“ 优质燃料 ”,为整个引擎源源不断地供给高品质能源,是确保认知准确性的基础。
2. 多模态数据湖 :扮演着“ 动力系统 ”的角色,负责高效处理和转化多模态数据,激发并转化能量,为上层应用提供坚实的数据基建。
3 数据智能体 :则是飞行器的“ 主体机身 ”,是承载和实现最终价值的核心载体,它直接切入业务场景,将数据和模型的能力转化为可感知的业务成果。
「企业认知引擎」的核心价值在于,它能帮助企业系统性地将混沌、复杂的数据,梳理成稳定、有序的可用资产,并在此基础上为企业构建起一个可持续迭代、自我优化的“认知飞轮”。
高质量数据集:
供给能源的「优质燃料」
作为驱动「企业认知引擎」这架“飞行器”高速运转的燃料,高质量数据集通过将企业原本庞杂无序的数据资源进行高效整合并进行重新梳理,为企业在新阶段的跃升提供源源不断的能源输入。
火山引擎高质量数据集目前已经完成了三个方面的能力拓展:
1. 从辅助构建到成品孵化: 不仅提供工具支持企业构建,更将孵化并提供可直接使用的 成品数据集 ,迅速扩大企业可用的优质数据规模。
2. 从通用能力到垂直深耕: 在通用能力之上,持续深化对 垂直领域知识 的补充与积累,确保数据集具备行业深度和专业性。
3. 从单一产品到全链路能力: 构建覆盖数据采集、清洗、标注、评估、应用等环节的 全链路配套能力 ,形成强大的产品矩阵。
对企业来说,数据质量几乎奠定了AI应用落地后的可用上限,越是高质量的数据越能为AI应用奠定准确性基础,火山引擎高质量数据集能做的,是帮助企业能够基于高质量数据,实现从“能用AI”到“用好AI”的步伐跨越。
多模态数据湖:
激发能量的「动力系统」
多模态数据湖是「企业认知引擎」这架“飞行器”的动力系统,其核心在于帮助企业构建出 AI友好的数据新基建 ,让企业能够通过一体化的数据处理与推理能力,实现从“广纳可用数据”到“提升处理效率”的关键跨越。
过去,传统以 BI 为中心的数据架构,在面对多模态数据和 AI 应用时往往力不从心;火山引擎多模态数据湖解决方案则从核心三方面实现突破,助力企业真正落实“AI友好”:
1. 数据处理与推理一体化 :打破了过去数据处理(ETL)与模型推理分离的壁垒,通过内置的 Spark、Ray、Daft 等引擎,实现数据在处理流程中即可进行在线或离线的 AI 推理,大幅缩短了“数据到价值”的链路。
2. 访问方式更灵活 :服务的对象从传统的 BI 工具,扩展为支持 AI Agent、多智能体协同(A2A)、模型控制协议(MCP)等多样化的访问方式,满足 AI 应用的复杂调用需求。
3. 算力资源深度融合 :超越了传统的 CPU+GPU 算力堆叠,创新性地引入“Token”作为算力资源的一部分,探索“模型即服务”(MaaS)的新模式,使模型本身成为可被灵活调度的资源。
在Data+AI论坛上,火山引擎多模态数据湖解决方案还发布了数据处理Agent和大数据运维Agent,以实际化的Agent应用为企业打样真正的“AI友好”。
其中数据处理Agent内置超过 200 种 AI 智能算子,覆盖从 PDF 解析、图片识别到音视频处理等各类非结构化数据的复杂预处理需求。这使原本耗时耗力的工作实现标准化、自动化,为模型训练和应用提供了高质量、高效率的数据准备能力;
大数据运维Agent则聚焦在企业数据运维场景,通过一键自动检索、定位,自主生成修复/优化方案,以及智能问答等系列能力,简化企业在数据运维场景的繁杂工作,降低人力成本投入,提升企业效率。
数据智能体:
承载价值的「主体机身」
数据智能体作为最可被显现的角色,构成了「企业认知引擎」这架“飞行器”的主体机身。它将高质量数据集的无限能量和多模态数据湖的澎湃动力,转化为直接的应用价值,并深度融入在企业的各项业务流程。
目前,火山引擎数据智能体服务已初步形成一个覆盖核心业务全场景的 Agent 矩阵:
1. 智能分析 Agent :定位为“AI 大数据分析与洞察研究专家”,它兼顾常规业务的“问数”需求与深度分析场景。通过在 意图理解、数据调用、多智能体协同 以及“ 规划-行动 ”循环(Plan-Act Loop)等方面的技术飞跃,推动数据分析从“报表自动化”走向“分析智能化与自主化”。
2. 智能营销 Agent :作为“新一代 AI 营销决策中枢”,它能够深度融合公域与私域的用户数据,洞察用户生命周期价值,辅助营销人员制定更精准的投放策略、内容创意和活动方案,实现从“拍脑袋决策”到“数据驱动增长”的转变。
3. 用户研究 Agent :致力于成为“新一代用户精准洞察与决策助手”,通过对海量用户反馈、行为数据和舆情信息的深度分析,帮助企业快速定位产品问题、挖掘潜在需求、洞察核心客群,将原本数周的用研周期缩短至小时级。
值得注意的是,火山引擎数据智能体服务并非只局限在当前的应用场景之中,而是会依据企业的所需场景积极拓展,最终实现业务场景全覆盖。
认知突围
驱动企业未来
正如面对AI时代,有的企业学会了使用新的工具,一件不趁手,就换下一件;有的企业则学会了接受新的认知,在使用工具前先确认哪一件最趁手。
前者可能短时间能解决一些问题,但当面对新问题时,所有复杂手续都得再来一遍;后者可能初阶段需应对来自思想和动手能力上的双重挑战,但却能找准最适合自己的那一把“工具”,并在长期内有效应对未来变化。
“企业认知引擎”能够为企业带来的,正是后者——不过更好的是,从优质燃料到动力系统,再到主体机身,火山引擎数智平台已经为企业搭建好了这一架“飞行器”,通过整合多模态数据湖、高质量数据集和数据智能体服务的综合能力,让更多企业能规避AI时代带来的升级阵痛,在Data+AI的爆发力和轰鸣声中腾空而起,最终高效实现“认知突围”与“持续增长”。
