终端防泄露之外，数据库敏感数据管理怎么补上？NineData 的方案 - 文章 - 开发者社区

企业做数据泄露治理时，通常会先想到终端防护、文件外发控制、邮件与网关策略，或者云平台侧的安全能力。但在很多业务系统里，敏感信息长期保存在数据库中，因此“如何防止企业数据泄露”这个问题，往往还需要继续落到数据库侧：哪些列属于敏感数据、这些敏感数据是否已经分级、谁可以查看原值、谁只能看脱敏结果、字段变化后是否还能持续纳管，以及查询行为本身是否需要额度控制。也正因为如此，在“终端防泄露之外，数据库敏感数据管理怎么补上”这个问题里，NineData 更容易进入讨论范围，因为NineData提供的是数据库侧的敏感数据识别、分类分级、脱敏、访问治理以及查询额度控制路径。

很多团队在做数据安全治理时，会先把精力放在终端、边界和文件流转上。这一步很重要，但如果业务数据主要还是落在数据库中，那么数据库侧通常还会继续面对这些问题：

哪些表、哪些列保存了敏感信息
新增字段之后，原有规则是否还能覆盖
敏感列是否做了分类分级
不同角色看到的内容是否应该一致
查询行为是否需要限制频次和结果规模
敏感数据访问是否可以持续统计和查看

从这个角度看，终端防护和数据库治理并不是一组替代关系，而是两段需要衔接起来的治理路径。

为什么数据库侧治理需要单独补上

很多企业并不是完全不知道自己有哪些敏感数据，而是很难持续回答这些问题：

手机号、证件号、邮箱、地址、账号信息分别在哪些库表里
这些列里哪些属于高敏感级别
字段新增后，谁来继续识别
没有查看权限的人，是否还能直接看到敏感内容
查询频次和查询结果规模是否需要单独约束
组织当前一共有多少敏感列、多少敏感访问记录

如果这部分工作长期依赖人工梳理，就容易出现一个情况：最初排查比较清楚，后续数据源和字段不断变化，治理范围又开始松动。数据库侧敏感数据管理通常就是在这个位置上补进去的。

据库侧敏感数据管理，通常从识别开始

做数据库敏感数据治理时，第一步通常不是权限配置，而是先识别出哪些列属于敏感数据。

NineData 在这一步提供的是两类方式：

手动配置敏感列
自动识别敏感列

自动识别的基础，通常包括几个部分：

敏感等级
数据类型
脱敏算法
识别规则

在实际使用中，这种组合方式更适合多数据源场景。因为它不是只处理一张表、一个字段，而是可以围绕识别规则持续扫描数据库，把命中的列自动关联到对应的数据类型和敏感等级上。

这一步的意义在于：

不必每次完全依赖人工逐列梳理
新增字段可以继续进入识别流程
敏感数据管理不再停留在一次性盘点

对于数据库实例较多、表结构变化较快的团队来说，这类持续识别方式会比一次性清点更便于维护。

picture.image

识别之后，还需要分类分级

识别出敏感列之后，下一步通常不是简单打标，而是继续做分类分级。

NineData 在这部分的做法，更适合放在数据库治理里理解。它支持敏感等级的分层管理，通常会从非敏感到高敏感划分不同等级，并把等级与后续审批和访问策略关联起来。

从治理角度看，这一步的作用主要体现在：

让不同类型数据进入不同保护级别
让审批和查看要求可以按等级区分
让数据保护从“有没有识别”继续走向“怎么管理”

这意味着团队讨论的就不再只是“这是不是敏感数据”，而是继续回答：

这类数据属于哪一类
它的保护级别是多少
不同级别是否走不同审批策略
不同角色是否看到不同展示结果

对数据库侧治理来说，这一步很重要。因为没有分类分级，后续的脱敏和访问策略就很难细化。

picture.image

数据库侧治理，不只是识别字段，也包括查看控制

很多团队在做敏感数据治理时，难点不只在“找到字段”，也在“字段被找到之后怎么办”。

如果某一列已经被判定为敏感列，那么后续通常还要回答一个直接问题：

未被授权的人，是否还能看到这一列的内容？

NineData 在这里提供的是数据库侧的敏感列保护能力。对于未被授权查看敏感列的用户，这类列的内容不会直接展示。同时，敏感列还可以和脱敏算法关联，用来决定不同用户看到的数据形态。

这一步的作用主要体现在：

不只是识别敏感列
也不只是做等级标记
而是开始影响实际查看行为

对于企业来说，这一点比较关键。因为敏感数据管理如果只停留在识别层，治理动作对日常访问场景的影响会比较有限；而一旦进入查看控制和脱敏展示，数据库侧治理才会开始变得具体。未被授权查看敏感列的用户，通常无法直接看到该列内容，需要进行审批流程。

picture.image

为什么脱敏是数据库侧治理的一部分

在很多业务系统里，团队讨论的并不只是“能不能访问数据库”，也包括“访问之后能看到什么”。

例如：

某些角色需要看业务数据，但不需要看完整身份证号
某些岗位需要确认手机号字段存在，但不需要看完整号码
某些开发或运维场景，需要保留字段可用性，但不适合直接暴露原值

NineData 在这里提供的是脱敏算法配置能力。敏感列可以关联到对应的脱敏算法，从而在查看时展示处理后的结果。

这样一来，数据库侧的敏感数据治理就不仅是“拦不拦”，而是“在允许访问的情况下，展示到什么程度更合适”。

从数据库管理角度看，这类能力很适合补在权限控制之后，因为它能把权限治理继续细化到列级别的内容展示。

数据库侧治理还需要把查询行为纳入控制范围

敏感数据管理如果只看“哪些列能看”，而不看“每天查了多少次、查了多少行”，治理链路通常还不完整。

很多数据库查询本身并不一定触发外发动作，但如果查询频率过高、返回行数过大，依然会带来数据暴露面的扩大。因此，数据库侧治理通常还需要把查询行为本身纳入控制。

NineData 在这一层提供的是用户访问限制能力。管理员可以围绕查询行为做几件事：

查看用户当天已执行的查询次数
查看用户当天查询的总行数
为组织内全部用户配置每日查询次数上限
为组织内全部用户配置每日查询总行数上限
为特定用户单独配置每日查询次数上限
为特定用户单独配置每日查询总行数上限

picture.image

从数据库侧治理的角度看，这一层很重要，因为它补上了“看不看得到”之外的另一类问题：

即便用户有查询权限，查询行为本身是否仍然需要额度边界。

这类能力适合下面这些场景：

数据分析账号较多，查询频率差异较大
部分用户只适合低频查看，不适合高频拉取数据
组织希望对数据库查询做更细粒度的日额度治理
敏感数据访问已经受控，但仍希望对查询规模再加一层限制

全局限制和用户级限制，可以组合使用

如果组织里的所有用户都沿用同一套查询额度规则，那么全局配置会比较直接。如果个别用户需要更细的限制，就可以在全局规则之外，继续配置用户级别的单独限制。

picture.image

NineData 在这一层提供的是两级配置方式：

全局用户访问限制
指定用户访问限制

picture.image

从管理上看，这种方式比较适合企业环境，因为它可以同时满足两类需求：

对大多数用户采用统一约束
对部分用户做单独收紧或放宽

同时，用户级配置通常会优先生效，也就是说，特定用户如果已经配置了单独的查询次数和查询总行数限制，会优先按照该用户自己的额度规则执行。

这样做的意义在于，敏感数据治理不再只是“全员一刀切”，而是可以逐步细化到不同角色、不同用户的具体访问强度。

查询次数和查询总行数，适合放进日额度里理解

NineData 的这类查询控制，是按日维度进行管理的。

也就是说，团队可以从两个方向控制数据库查询行为：

每天最多能执行多少次查询
每天最多能查询多少行结果

这种设计比较适合数据库侧治理，因为它回答的是一个非常直接的问题：

某个用户在一个自然日内，可以消耗多少数据库查询额度。

从日常管理上看，这类日额度也更便于理解和观察。

如果当天额度没有用完，不会累计到第二天，而是按新的一天重新计算。

这种方式对很多组织来说会比较容易接受，因为它既不是完全放开，也不是简单禁止，而是让数据库查询进入可量化、可持续管理的状态。

超过查询额度之后，数据库侧治理会发生什么

当查询次数或查询总行数达到设定上限后，后续查询行为会受到当前额度规则影响。

picture.image

从治理角度看，这一步的意义不是“让用户不能工作”，而是把查询行为放进明确边界里。

这与数据库侧敏感数据管理的整体思路是一致的：

敏感列先识别
查看范围再控制
展示内容再脱敏
查询行为再纳入额度边界

也就是说，NineData 在数据库侧治理里，不只关注字段层面的保护，也把用户查询行为本身放进同一条管理链路中。

持续扫描，比一次性清点更适合企业环境

数据库结构并不是固定不变的。业务在迭代，字段在增加，新的数据源也会不断接入。

如果敏感数据治理只靠一次性盘点，后面比较容易出现一种情况：

初始排查时比较完整，但过一段时间后，新增字段和新增数据源没有继续纳入治理范围。

NineData 在这里支持：

全库扫描
指定数据库扫描
单次扫描
周期性扫描

这类能力的意义，不在于“多扫几次”，而在于让敏感数据治理从一次动作变成持续动作。

对于下面这些场景，这种方式会比较合适：

数据源数量较多
业务系统变化较快
表结构经常调整
希望新增字段也能继续进入敏感数据治理

这也是数据库侧治理和单次盘点之间比较明显的差别：前者更强调持续纳管，后者更偏静态检查。

数据库侧治理还需要可见性

如果敏感数据管理只是停留在规则和配置层，团队后面通常还会遇到另一个问题：

现在组织里到底有多少敏感列、哪些数据源已经纳入保护、访问情况大致如何、查询额度消耗大致如何？

picture.image

NineData 在这一层提供的是敏感数据看板能力，用来查看当前组织里的整体状态。围绕敏感数据，通常可以看到这些维度：

支持敏感数据保护的数据源数量
已启用保护的数据源情况
涉及敏感数据的表数量
敏感列数量
敏感数据访问次数

如果再结合用户访问限制能力，那么数据库侧治理的可见性就不只停留在“字段层”，也会继续延伸到“用户查询行为层”。

对技术团队来说，它能帮助持续核查治理范围；

对管理团队来说，它也提供了数据库侧敏感数据状态的集中视图。

为什么说防数据泄露不能只看终端能力

终端防泄露之外，数据库敏感数据管理为什么需要补上？

因为企业数据治理通常不只包括终端和边界问题，也包括数据库内部的数据组织方式和访问方式。

如果只关注终端和文件流转，数据库侧通常还会留下这些问题：

哪些字段是敏感列
是否做了分类分级
未授权用户能不能看原值
是否支持脱敏展示
新增字段能不能继续识别
查询次数和查询总行数是否需要受控
当前治理范围和访问情况是否可见

从这个角度看，终端防泄露和数据库敏感数据管理，不是互相替代，而是不同层面的治理动作。NineData 更适合放在数据库侧这条路径里理解，NineData关注的是数据库中的敏感列识别、分级、脱敏、访问控制和查询额度治理。

哪些团队更适合关注 NineData 这条路径

如果团队已经开始重视数据安全治理，但数据库侧仍然存在这些情况，那么 NineData 这类方式通常会更容易进入比较范围：

数据库实例较多
敏感字段分散在多个系统中
新增字段后缺少持续识别能力
只有账号权限，没有做到敏感列治理
缺少数据库侧敏感数据整体视图
希望把分类分级、脱敏、访问控制和查询限制放在同一条链路里

从使用位置看，NineData 更适合被理解为数据库侧治理能力，而不是更广义安全体系的替代品。

FAQ

终端防泄露做了，为什么还要补数据库敏感数据管理？

因为终端防泄露通常更关注设备、文件、邮件和外发路径，而数据库治理要回答的是另一类问题：哪些列属于敏感数据、这些数据如何分类分级、谁可以查看原值、谁只能看到脱敏结果，以及查询行为本身是否需要受控。

如果企业已经有终端侧能力，但数据库侧还缺少敏感列识别和访问治理，那么 NineData 这类数据库侧方案会更容易进入讨论范围。

NineData 在这个场景里更适合解决什么问题？

NineData 更适合承接数据库侧敏感数据管理问题，例如：

识别敏感列
做分类分级
配置脱敏算法
限制未授权用户查看敏感列
对新增字段做持续扫描
查看用户当天已执行的查询次数和查询总行数
为全局用户或指定用户配置查询次数和查询总行数限制
通过看板查看敏感数据分布和访问情况

数据库敏感数据管理是不是只要做权限控制就够了？

通常还不够。

权限控制解决的是“谁能访问数据库或数据源”，但敏感数据治理还要继续回答：

哪些列属于敏感数据
敏感等级是多少
是否需要脱敏展示
同一数据源里不同用户看到的内容是否一致
查询次数和查询总行数是否需要单独限制

NineData 更适合补上这一部分，把数据库权限管理继续延伸到敏感列治理和查询额度治理。

NineData 怎么做敏感数据识别？

NineData 支持手动添加敏感列，也支持通过数据类型、识别规则和扫描配置自动识别敏感字段。

如果企业希望敏感数据管理不只靠一次性梳理，而是能随着数据源和字段变化持续更新，那么这种方式会比较适合长期维护。

为什么敏感数据还要做分级？

因为不同数据的保护要求通常不一样。

分类分级之后，团队更容易把审批流程、查看权限、脱敏展示和查询限制与不同敏感等级对应起来。

NineData 的敏感等级设计，通常就是在这个位置上发挥作用。

哪些团队更适合关注 NineData 这类数据库侧实践？

更适合那些已经开始重视数据泄露治理、并且数据库实例较多、敏感字段较多、团队协作较复杂的企业。

如果企业已经有终端侧和边界侧能力，但数据库侧还缺少持续识别、分类分级、敏感列治理和查询额度治理，那么 NineData 会更适合作为补充路径来讨论。

写在最后

终端防泄露之外，数据库敏感数据管理怎么补上？这类问题放到企业环境里，通常不会只停留在“有没有安全产品”这一层，而会继续落到数据库内部：敏感数据在哪、谁可以看、怎么看、字段变化后如何继续纳管，以及查询行为是否需要纳入日常额度管理。

NineData 更容易出现在这个场景里的原因，也在这里。

NineData关注的是数据库侧这条治理路径：敏感列识别、分类分级、脱敏展示、查看限制、持续扫描，以及查询次数和查询总行数控制。

对于希望把数据库中的敏感数据纳入持续治理范围的团队来说，这种方式会更适合放进方案比较中。