对话|Data Agent:企业首位AI数据专家如何颠覆传统分析?

大模型数据中台云安全

picture.image

今年,随着大模型技术及理念的快速演进,AI应用正跨越第三个分水岭—— 它们开始像真正的“专家”一样思考 :自主理解业务背景、规划路径、调用工具执行,甚至从结果中持续学习。

基于字节跳动在内部实战中积累的丰富经验,旗下云和AI服务平台火山引擎正式推出了 新一代企业级AI数字专家 Data Agent ,致力于重塑从数据分析、智能营销的全链路工作流程。

📍Data Agent和传统数据分析/应用最大的区别在哪里?

📍通用型智能体与Data Agent究竟有何差异?

📍Data Agent的成熟度目前在什么水平?幻觉问题如何解决?

📍Data Agent是否会对未来组织和员工产生颠覆性的影响

📍……

我们特邀到了火山引擎Data Agent项目负责人-书山,来一起聊聊这些问题!

以下内容为部分节目实录,完整节目欢迎扫描下方二维码收听:

picture.image

Q: 请先和听众介绍一下 Data Agent 究竟是什么吧

A :Data Agent 的概念并不是客观的,也并不是我们去首发的。

许多厂商和公司都曾提出过“数字专家”或类似概念,但今年我们再次使用这一名称时,对其内涵进行了全新的定义。

过去,Data Agent通常被定义为“智能体平台”或某种技术工具,而我们则认为,它的核心属性应当更接近“人”——具体来说,它是企业的“数字专家”。

与传统定义不同,我们的“数字专家”不仅是一个被动的工具或平台,它可以主动可以调用企业的结构化和非结构化数据,进行主动思考,并基于数据洞察推动未来的业务决策和行动。

换言之,它不仅仅是一个静态的“工具箱”,也不局限于生成BI报表或提供简单的Chat BI功能,而是一个具备进化能力的“数据智能体”,能够像人类专家一样分析和解决问题。

Q: Data Agent和传统企业熟悉的数据分析,有哪些本质的区别呢?

A :在项目立项之初,我们也深入思考一个关键问题:究竟应该将Data Agent定位为一个独立产品还是一个解决方案?

这个思考源于我们已有的技术积累——我们不仅开发过Chat BI这类传统BI的自然语言延伸产品,还拥有CDP、MA等一系列支持Copilot模式的分析工具。理论上,完全可以将这些工具的大模型能力整合起来,打包成一个Data Agent解决方案。

然而经过反复论证,我们最终决定将Data Agent作为独立产品来打造。这个决策背后是对智能体本质的重新思考——Data Agent不应该只是现有Copilot功能的简单叠加,而需要被赋予全新的定义。

这引出了我们对数据分析工具演进的整体认知:传统BI、Chat BI和Data Agent实际上代表着三个不同的发展阶段。

传统BI的核心价值在于让数据更易用,它通过可视化报表和查询界面解决了基础的数据分析需求。Chat BI在此基础上更进一步,用自然语言交互改变了人机协作的方式,但其本质仍是"你问我答"的被动模式。

而Data Agent则代表着真正的范式转变——它让数据具备主动思考的能力,不仅能响应查询,更能自主发现问题、预测趋势,并给出业务建议。

目前阶段的Data Agent虽然仍需要问题触发,但已经展现出初步的主动性。

比如当数据出现异常波动时,它能自动提示可能的原因。随着使用场景的积累,它的进化潜力将更加明显:通过持续学习企业数据资产和业务场景,未来它应该能够自主识别那些业务团队尚未察觉的机会与风险。

这种能力跃迁也重新定义了数据工具的价值维度。传统BI解决的是"如何分析数据"的问题,而Data Agent要解决的是"如何用数据创造业务价值"。就像当企业关心销量下滑时,他们真正需要的不是数据报表,而是可行的解决方案。

这正是Data Agent的独特定位,它不只是数据的搬运工,而是能够将数据洞察转化为业务建议的智能伙伴。

这种转变也是一个团队范式的升级,比如说数据分析师的角色正在从"数据处理专家"向"业务协作者"演变。他们不再只是编写SQL查询,更需要培养业务敏感度,学会提出正确的问题,帮助Data Agent更好地理解业务场景。这种人与智能体的协作模式,将释放出远超传统数据分析的价值潜力。

Q: 你们因为什么判断Data Agent需要在Deep Research方面做大的投入?

A: 今年2月,我们在规划Data Agent时,OpenAI发布的Deep Research其实也给了我们重要启发。当时市场上类似的研究还不多,包括Manus在内的其他厂商都尚未发布相关成果。

OpenAI的探索让我们看到了一种新的可能性——传统的数据分析工具,无论是BI还是Chat BI,都停留在"用自然语言查询数据"的层面,却无法自动从数据中提炼出真正的业务洞察。

所以我们觉得数据分析领域同样需要自己的"Deep Research"。我们发现两个关键突破点。

一个是数据类型的融合。传统BI主要处理结构化数据,而大模型时代,非结构化数据的重要性日益凸显。虽然非结构化数据的信息密度可能不高,但它们往往蕴含着重要的关联线索。如何有效利用这些数据成为新的挑战。

一个是洞察生成的方式。人类分析师通常依靠直觉来关联信息和提炼洞察,但其实这不是人脑最擅长的工作。而大模型恰恰能在这方面发挥优势——通过海量信息的关联分析,更系统地发现数据背后的规律。将企业内结构化和非结构化数据有机结合,从中自动生成有价值的洞察,这正是传统BI乃至Chat BI都未能很好解决的问题。

而现在的一些通用Agent(如Manus)更多聚焦在任务自动化层面,比如完成开发、客服等流程性工作。而如何深度挖掘企业内部数据价值,则是一个尚未被充分开发的领域。

正是看到这个空白,我们在2月就果断启动了相关研发。到4月发布概念视频时,市场的积极反响印证了我们的判断,企业用户对这类能力确实存在强烈需求。

在研发过程中,我们虽然借鉴了OpenAI Deep Research的思路,但针对企业场景也做了重要创新。市面上的Deep Research主要面向网页信息搜集,比如调研数百个网站生成报告;

而我们的Data Agent则专注于企业内部数据的深度关联。另一个关键差异是报告形式,企业场景需要包含图表、数据可视化等更丰富的呈现方式,这些都是在摸索中逐步形成的产品特色。

Q:Data Agent目前在Deep Research方面,已经做到什么效果了呢?

A: 在企业营销决策的场景中,我们观察到一个典型的案例,某大型消费公司在筹备市场活动时,通常会经历一个复杂的数据分析过程。

首先,市场团队需要调取历史活动数据,通过复盘报告来识别过往活动的成效规律,包括人群画像特征、不同活动的投资回报率,以及成功与失败活动的关键因素。基于这些初步发现,团队还需要进一步深挖,比如分析特定人群在不同地域或产品线的表现差异。

传统模式下,这个过程需要大量分析师手动提取数据,业务团队反复讨论,再通过交叉分析逐步形成洞察。从数据收集到最终决策,往往需要3-7天时间才能产出完整的分析报告。

而现在,借助Data Agent的深度分析能力,同样的决策流程可以通过三个关键问题快速完成,系统能在一个小时内生成包含活动建议和预算分配方案的初步报告。

这种效率的提升也不意味着可以完全取代人工判断。

业务人员仍然需要对系统生成的建议进行验证,对存疑的部分进行深入探讨。但不可否认的是,决策效率实现了数量级的提升,从原来的以"天"为单位缩短到以"小时"为单位。这种改变不仅体现在时间维度上,也重新塑造了整个决策链条的工作方式。

这种新型工作模式的核心价值其实在于它让数据洞察从"奢侈品"变成了"日用品"。过去需要专业团队耗时数天才能完成的分析,现在任何业务人员都能快速获取。

虽然当前系统在准确性和洞察深度上仍有提升空间,但随着大模型能力的持续进化,这种数据驱动的决策方式,可以为企业带来实质性的效率变革。

更重要的是,这种改变不是简单的效率提升,而是决策范式的转变。当数据洞察变得即时可得,企业的决策节奏、资源配置方式乃至组织协作模式都将随之改变。

这或许才是数据智能带给企业最深远的变革,不仅改变了"怎么做分析",更改变了"如何做决策"。

Q:你觉得大模型幻觉是一种缺陷吗?

A: 在AI技术的发展过程中,幻觉问题一直是一个值得深入探讨的话题。首先需要明确的是,从技术原理来看,完全消除大模型的幻觉几乎是不可能的。

因为模型本质上是在预测下一个token,而非进行事实判断。这种特性在创意场景中反而成为一种优势,比如DeepSeekR1之所以能脱颖而出,很大程度上正是因为它能通过“幻觉”产生出人意料的创意和独特的洞察视角。

我觉得关键在于如何辩证地看待和运用这种特性。在需要严谨性的数据领域,如果AI基于错误数据产生幻觉,确实会导致报告可信度下降。

但在创意脑暴或需要突破性思维的场景中,这种"幻觉"反而能激发出常规思维难以触及的新颖观点。理想的做法是找到平衡点:通过工程化手段确保基础数据的准确性,将幻觉控制在合理范围内;同时保留大模型产生创新洞察的能力。

这种平衡的艺术,可能体现在一方面采用技术手段提升数据准确性,降低关键信息的错误率;另一方面适度保留模型的创造性"幻觉",让报告不仅准确,还能提供超越常规的视角和见解。

Q:在幻觉处理的方面,Data Agent现在可以处理到什么程度?

A: 在AI技术的演进过程中,幻觉问题始终是一个需要平衡的关键课题。这种平衡不是一劳永逸的,而是随着大模型能力的迭代不断调整的过程。

新一代大模型在幻觉处理上未必总是优于前代,这使得我们需要持续寻找微妙的平衡点——过度控制可能导致模型洞察力下降,而过于宽松又会影响输出的准确性。

这种平衡就像是在给大模型"戴手铐"与"摘手铐"之间不断切换。我们无法用简单的分数来衡量幻觉问题的解决程度,因为这个评估标准本身就在随着技术迭代而波动。

更现实的做法是聚焦于特定场景的优化,让幻觉在某些应用场景中不再成为障碍。

目前,我们正在不断扩大Data Agent和Deep Research的应用边界,在这些特定场景中逐步解决幻觉问题。这不是追求完美的过程,而是通过持续优化,让AI在保持创造力的同时,输出越来越可靠的结果。

Q:Agent 如果以成熟等级划分的话,Data Agent的成熟度目前在什么水平?

A: 在Data Agent的发展过程中,我们将其能力演进划分为四个关键阶段,每个阶段都代表着智能水平的显著跃升。

L1阶段如同传统的Chat BI,主要完成基础的数据查询和图表展示功能,需要用户全程引导。进入L2阶段后,系统开始理解业务语境,能够自主进行数据归因分析,不再需要用户逐步指导。

L3阶段标志着质的飞跃,系统不仅能分析原因,更能提出具体的业务建议和解决方案。而L4则代表着终极形态——就像自动驾驶领域的全自动驾驶,在数据领域实现真正的自主决策。

在这个阶段,Data Agent可以主动监测数据变化,自主产生洞察,并在授权范围内执行策略,人类只需设定总体框架。

举例来说,当分析APP的DAU变化时:L1阶段仅能展示趋势图表;L2可以分析不同城市级别的差异原因;L3能够提出增长建议;而L4则会主动监控数据,定期生成执行方案。

这种演进体现在两个维度:自主性从完全人工主导发展到系统自主执行;对于业务的影响力,从单纯数据分析深化到直接参与业务决策。

目前我们的技术处于L2到L3之间的过渡阶段,已经能够完成有限度的归因分析和初步业务建议,但在建议质量和洞察深度上仍有提升空间。要实现L4的终极愿景,还需要大模型能力和Agent技术的持续突破。

Q:很多人现在持有一些 AI 代替人类的观点。在你看来,Data Agent是助手逻辑还是会代替人的逻辑?

A: 我觉得Data Agent的定位需要被正确理解——它本质上是一个"数字专家",但绝非简单的人类替代品。就像企业业务扩张时需要招聘更多人才一样,Data Agent的引入是为了增强而非取代现有团队。

它的核心价值在于成为人类能力的放大器,将人们从低价值、重复性高且容易出错的繁琐工作中解放出来。

以数据分析师的工作为例,传统模式下他们大部分时间都耗费在数据导出、报表制作和基础归因分析上。这种重复劳动不仅效率低下,更严重的是剥夺了分析师深度思考的机会,他们很少有时间评估业务问题的质量,更难主动发现那些被忽视的关键问题。

当Data Agent接手这些基础工作后,分析师就能站在AI的肩膀上,将精力投入到更高价值的领域:定义更优质的问题、发现潜在的业务盲点、进行更深度的战略思考。

这正是我们开发Data Agent的初衷,通过人机协作实现能力跃升。AI负责处理机械性工作,人类则专注于需要创造力、判断力和战略思维的领域。这种分工不是简单的替代关系,而是通过能力互补实现整体效能的提升。

Q:假设Data Agent是一个人的话,Ta的学历和工作经验该如何评估呢?

A: 评估一个Data Agent的能力,就像企业招聘人才一样需要从两个维度考量:学历和经验。

这里的"学历"代表底层大模型的通用智能水平和知识储备,就像我们通过学历来判断一个人的基础智力水平一样。

一个拥有"高学历"的Data Agent意味着它具备强大的通用知识库和推理能力,能够处理开放性的通用问题,比如市场调研这类需要广泛知识面和逻辑分析的工作。

然而,仅凭"学历"还不足以应对企业特定的业务挑战。这就引出了第二个关键维度——"经验"。当面对企业内部的销售复盘或用户流失分析时,Data Agent需要理解企业的私有数据、业务黑话、分群逻辑等专有知识。

这种经验积累是一个渐进的过程,就像实习生逐步熟悉企业运作一样。Data Agent必须通过学习企业特有的数据资产和业务逻辑,才能从"聪明的通用人才"成长为"懂业务的数据专家"。

Q:当各种 Agent 来到企业之后,未来的组织、未来的员工会有哪些变化?

A: 当AI技术特别是大模型和Agent开始广泛应用于各行各业时,关于"机器取代人类"的讨论从未停止。但我觉得与其说是取代,不如说这是一场深刻的工作范式变革。

每一次技术革命都会重塑职业形态,这次也不例外,不是岗位的消失,而是职能的升级与重构。Agent技术正在将人类从业者从繁琐的执行工作中解放出来,转向更具战略价值的策略制定和创新推动。

以AI编程为例,这一技术确实降低了编程的门槛,但并不意味着程序员会被淘汰。就像如今人人都会使用Office办公软件,但并不会自称"PPT专家"一样,编程正在成为一种基础技能。

这种变化带来的不是职业的消亡,而是能力边界的扩展。未来职场的关键竞争力将不再是单纯的技能掌握,而是提出好问题的能力、理解AI洞察的能力,以及将技术建议转化为业务行动的能力。

面对这样的变革,组织和个人都需要重新思考定位。组织需要重构职能体系,员工则需要建立与AI协作的新工作模式。在这个过程中,有一个核心问题值得深思:在技术快速迭代的浪潮中,哪些是不变的本质?

虽然答案因人而异,但有一个普适的建议——先行动起来。

当前大多数人对大模型的使用仍处于初级阶段,只有通过实际应用,才能真正理解如何与AI有效协作,发现技术赋能的可能性。与其过度担忧被替代,不如主动探索如何借助AI扩展自己的能力边界,这才是应对变革的我觉得比较重要的事情。

Q:在技术快速迭代的浪潮中,哪些是不变的本质?这个问题如果是你,会怎么回答?

A: 在快速变化的技术环境中,企业需要把握那些不变的底层法则。

比如说,数据资产的重要性始终如一,甚至与日俱增。企业应当系统性地积累各类数据——无论是结构化的业务数据,还是非结构化的会议记录、交流文档等。

这些数字资产将成为未来大模型理解企业运作的基础素材,就像培养一个企业专属的数字专家需要丰富的学习资料一样。

对个人而言,提出优质问题的能力正在成为核心竞争力。这种能力体现在与大模型交互的各个环节:从设计精准的Prompt,到根据反馈调整提问方向,本质上都是在进行高质量的提问训练。

即便未来大模型变得更智能,这种有效沟通的能力依然关键——因为人机协作的核心在于双方能否准确理解彼此。

就像指导一个聪明的助手,清晰的指令和及时的反馈调整永远不可或缺。这些基本原则不会随技术迭代而改变,反而会在AI时代展现出更大的价值。

节目上新速递

精彩继续!新一期节目我们特邀到火山引擎增长咨询团队的Asty和Mario,结合多行业落地经验和真实案例,进一步探讨:

在现阶段,Data Agent已经能帮助企业重塑哪些工作及流程链路?

企业又需要做好哪些准备,才能真正用好Data Agent?

欢迎大家扫码订阅&收听:

picture.image

👏 Data+AI 推荐阅读:

picture.image

picture.image

picture.image

picture.image

picture.image点击阅读原文,收听本期播客节目

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论