Mamba架构的透明化之路,视觉SSMs的空间信息处理机制解析!

大模型机器学习算法

点击下方卡片,关注「AI视界引擎」公众号

( 添加时备注:方向+学校/公司+昵称/姓名 )

picture.image

picture.image

Image

状态空间模型(State Space Models, SSMs),尤其是Mamba架构,最近作为序列建模的Transformer替代方案崭露头角,能够在保持线性计算复杂度的同时实现与Transformer相媲美的性能。然而,尽管其有效性已得到验证,由于缺乏类似注意力机制的透明化机制,理解这些视觉SSMs如何处理空间信息仍具挑战性。

为填补这一空白,作者提出一种基于可控性的可解释性框架,用于量化输入序列中不同部分( Token 或图像块)对SSM内部状态动态的影响程度。作者提出了两种互补的计算方法:一种基于雅可比矩阵(Jacobian-based)的方法,适用于任意SSM架构,通过完整状态传播链来衡量影响;

另一种基于格拉姆矩阵(Gramian-based)的方法,专为对角SSM设计,通过闭式解析解实现更优的计算速度。两种方法均只需一次前向传播,具有线性复杂度,无需修改网络架构或调整超参数。作者在三种不同的医学影像模态上进行了实验验证,结果表明,SSMs能够自然地实现从浅层的弥散Low-Level纹理到深层聚焦且具有临床意义模式的层次化特征提炼。

作者的分析揭示了与诊断标准一致的领域特定可控性特征,网络层级中逐步增强的空间选择性,以及扫描策略对注意力模式的显著影响。除医学影像外,该框架在计算机视觉、自然语言处理及跨域任务中亦具有广泛的应用前景。

本研究将可控性分析确立为SSMs在所有领域中的统一基础性可解释性范式。

1 引言

卷积神经网络(Convolutional Neural Networks, CNNs)在计算机视觉领域占据主导地位,并成为分类、分割和目标检测等各类任务的默认架构。其成功源于其归纳偏置(inductive biases),通过权值共享实现平移等变性(translation equivariance),以及局部感受野(local receptive fields)的设计,这些特征与生物视觉系统分层处理信息的方式相吻合。CNNs通过堆叠卷积层高效地捕捉空间层次结构,在浅层学习如边缘等简单模式,而在深层学习更复杂的特征。然而,CNNs面临一个显著局限:其局部感受野限制了其捕捉全局上下文信息以及建模图像中长程依赖关系的能力 [1]。

视觉Transformer(Vision Transformers, ViTs)[2]的引入标志着一场范式转变,它将Transformer架构从自然语言处理[3]领域迁移至视觉任务,通过将图像视为 Patch 序列来实现。与CNN不同,ViTs采用自注意力机制(self-attention mechanism),使得每个 Patch 从第一层开始就能关注其他所有 Patch ,从而实现无需逐步扩展感受野的即时全局上下文建模。尽管其性能突破性地领先,但Transformer存在一个显著缺点:自注意力机制的计算和内存复杂度随序列长度

呈二次方增长(

)[4]。这种二次方增长使得在高分辨率成像数据(如医学图像)中遇到的超长序列上应用Transformer变得极为昂贵,难以实际部署。

这种状况在深度学习架构设计中产生了一个根本性的权衡。理想的模型应当能够捕捉长距离依赖关系,以高保真度处理局部信息,同时保持计算效率。虽然CNN在高效提取局部特征方面表现出色,但在处理全局上下文方面存在困难。相反,Transformer虽然能够很好地建模全局上下文,但其计算成本高昂,对于长序列而言变得难以承受。这一矛盾推动了对替代架构的积极探索,旨在实现两者的最佳结合。

近年来,状态空间模型(State Space Models, SSMs)作为一种强大的第三范式崭露头角。其理论基础可追溯至经典控制理论,源于Kalman的开创性工作[5]。SSMs通过线性动态系统(linear dynamical systems)控制的中间隐状态,将一维输入信号映射为输出信号,从而建模序列。早期深度学习中的SSM变体,如面向序列的结构化状态空间(Structured State Space for Sequences, S4)模型,表明这类模型可被表述为推理时的递归系统,或训练时的大卷积核,从而以近线性复杂度建模长距离依赖关系[6]。后续的改进变体,包括S5[7]和Liquid S4[8],进一步提升了模型的稳定性和表达能力,使SSMs在多个领域成为Transformer的可行替代方案。

在此基础上,Mamba架构引入了一项关键创新:选择性扫描机制 [9]。与以往的SSM不同,Mamba的隐状态转移矩阵

、输入矩阵

和输出矩阵

以及关键的离散化步长

均为输入相关,而非时间不变。这一设计使模型能够选择性地关注或忽略输入序列的某些部分,从而在隐藏状态中有效压缩相关上下文信息,同时让无关信息迅速衰减。

这种内容感知的推理机制使 Mamba 在序列长度上实现线性扩展,同时在多种基准测试中展现出与 Transformer 相当甚至更优的性能,涵盖语言建模 [9]、时间序列预测 [10]、图像分析 [11],甚至强化学习 [12]。这种效率、强大的表征学习能力与选择性相结合的独特特性,使 Mamba 以及更广泛的 SSM 家族成为下一代基础模型的有力竞争者,在众多应用领域具有变革性潜力。

尽管状态空间模型(State Space Models, SSMs)在多个领域得到日益广泛的应用,但一个关键的空白依然存在:作者缺乏系统化的方法来理解这些模型究竟学到了什么,以及它们如何处理信息。虽然Transformer得益于丰富的可解释性工具生态(如注意力可视化、注意力传播、检测分类器),但SSMs由于其信息流机制的根本差异而面临独特的挑战。与通过显式成对注意力权重聚合信息的Transformer不同,SSMs通过由微分方程所支配的隐状态动态来隐式传播信息。因此,无法通过检查注意力矩阵来回答“哪些输入token影响了输出?”这一问题,因为SSMs本身并无注意力矩阵。相反,作者必须分析输入如何随时间控制潜在状态的演化,这一问题位于深度学习与动力系统理论的交叉领域。

这种可解释性差距在医疗影像分析、临床决策支持和自动驾驶等高风险领域尤为突出,这些领域中监管机构日益要求对AI辅助决策提供机制性解释。例如,若基于SSM的诊断模型将某患者影像 Token 为高风险,临床医生需要了解是图像中的哪些区域导致了这一预测,以及这些区域对模型内部推理的影响程度。现有可解释性方法主要针对CNN和Transformer设计,在应用于SSM时存在三大根本性不足:

(1) 如Grad-CAM [13]、Integrated Gradients [14] 和 SmoothGrad [15] 等技术通过反向传播测量输出对输入扰动的响应来计算归因。然而,这些方法存在梯度噪声、饱和伪影以及对随机初始化敏感等问题 [16]。对于SSM(State Space Models),其涉及指数离散化

以及复杂的循环动态,梯度可能出现爆炸或消失,导致不同运行或超参数设置下的解释结果差异显著。此外,梯度方法需要多次前向-反向传播,对于长序列而言计算成本高昂,而这正是SSM表现优异的场景。

(2) 大量研究工作致力于通过分析 attention 权重来解释 Transformer 模型 [17]。然而,SSM(状态空间模型,State Space Model)并不具备 attention 机制,其信息传播依赖于状态转移,而非 token 之间的成对交互。近期尝试可视化 SSM 行为的方法主要依赖于临时性的启发式手段,例如绘制隐藏状态激活值或测量输出对输入 Mask 的敏感性 [18],但这些方法缺乏理论基础,且无法量化每个输入对模型决策过程的控制程度。

(3) 即使梯度法或扰动法生成了合理的显著性图,它们本质上仍是事后分析(post-hoc)的:这些方法试图逆向推导模型已经完成的计算过程,而非直接测量计算本身。正如Jain和Wallace [19] 对注意力权重所展示的,显著性高并不意味着影响力大,后续层可能完全抵消高度显著特征的贡献。对于状态空间模型(SSM),其中信息通过一系列状态转移(

) Stream ,作者需要一种能够直接衡量可控性(controllability)的方法:即在时间

的输入对隐藏状态轨迹的调控程度,以及由此对最终输出的影响。

本文提出了一种从根本上不同的SSM可解释性方法,其理论基础源于经典控制理论。与通过梯度近似影响或启发式解释隐藏状态的方法不同,作者引入了可控性(controllability)及其可控性Gramian这一数学上严格度量的概念,该概念在动力系统分析中已应用超过60年 [5],用以直接量化每个输入元素对SSM内部状态动态的影响程度。

可控性Gramian

衡量的是从某一给定输入出发所能达到的状态空间:若某一输入能显著影响隐藏状态(即具有高可控性),则在状态可观测的前提下(由输出矩阵

加权),该输入也将显著影响输出。

作者在三个截然不同的医学影像数据集上评估了所yinqing-X-VMamba_2511,包括一份灰度乳腺X光图像数据集、一份彩色皮肤科图像数据集以及一份细胞显微图像数据集,以检验其在视觉特征差异极大的场景下的泛化能力。作者将该方法应用于MedMamba架构 [20],这是一种基于SSM的先进视觉模型,已在上述数据集上完成训练。除视觉任务外,作者的可控性框架为SSM在所有领域中的研究开辟了新的方向,包括语言模型、时间序列预测、多模态模型以及强化学习。作者的可控性框架具备四项关键优势,使其与以往所有可解释性方法显著区分开来:

  1. 可控性并非一种事后近似,而是状态空间动力学的内在属性,源于控制理论的基本原理。其忠实性是构造上保证的:高可控性得分必然意味着对输出的高影响(在可观测性方面,作者已明确考虑)。这消除了注意力机制和基于梯度的方法所面临的忠实性问题。
  2. 通过在多层 SSM(State Space Model)的每一层计算可控性,作者揭示了信息如何通过模型的时间层次结构逐步优化。早期层捕捉Low-Level模式(如边缘、纹理),而深层则聚焦于语义特征(如物体、诊断指标)。这种逐层分析方法在 Transformer 中由于残差连接和非线性带来的限制而无法实现,因此为模型内部推理过程提供了前所未有的可解释性。
  3. 该方法对任意对角线 SSM(State Space Model)均具有架构无关性,无需针对特定任务进行调优,无需超参数调整,也无需修改模型架构。其适用范围涵盖语言建模( Token 级影响)、时间序列预测(时间重要性)、计算机视觉(空间显著性)、音频处理(时频分析)以及基因组学(碱基对相关性)。该方法的数学基础与具体应用领域无关,仅在不同应用场景中“影响”(influence)的解释有所不同。
  4. 影响得分(Influence scores)可在单次前向传播中计算,每个序列元素的时间复杂度为

,其中

为状态维度(通常为 8–64)。与需要通过可能不稳定的循环动态进行反向传播的梯度方法,或需要

次前向传播(

为序列长度)的扰动方法相比,该方法具有更高的计算效率。

2 状态空间模型(State Space Models, SSMs)

在核心上,状态空间模型(State Space Model, SSM)通过一个隐含的隐藏状态

,将输入序列

映射到输出序列

。这种表述在建模输出不仅依赖当前输入,还依赖所有先前输入历史的动态系统时尤为强大,而这些历史信息被编码在状态中。基础的状态空间模型由一对线性常微分方程(ODE)描述:

其中,

为状态矩阵,用于控制内部状态的演化;

为输入矩阵,决定输入如何影响状态;

为输出矩阵,用于将状态映射到最终输出;

为前馈矩阵,提供输入到输出的直接连接。在许多序列建模任务中,为简化起见,前馈项

通常被省略。

尽管连续时间表示在数学上具有优雅性,但深度学习模型处理的是离散数据。因此,必须将连续参数转换为对应的离散形式。这一过程称为离散化 (discretization),通常通过一个时间尺度参数

来实现,该参数表示采样步长。实现这种转换的一种标准方法是零阶保持 (zero-order hold, ZOH),该方法可得到离散时间矩阵

通过这些离散参数,SSM 可以表示为两种主要形式:递归形式和卷积形式。

循环形式:离散化的SSM可以像RNN一样,逐步地、顺序地进行计算。在时间步

的状态是基于前一状态和当前输入计算得到的:

这种循环形式在推理阶段(自回归生成)非常高效,因为它仅需前一状态即可。

然而,其顺序性使其在GPU等并行硬件上的训练速度 inherently 较慢。

卷积形式:为克服循环形式的训练 Bottleneck ,可以将模型展开。通过递归代入

的表达式,可将输出

表示为所有先前输入的函数:

该公式表明,SSM 等价于一个离散卷积。通过将输入序列

与一个结构化的卷积核

进行卷积,可以并行计算出整个输出序列

其中,长度为

的核

定义为:

这种卷积表示允许使用标准深度学习框架和快速傅里叶变换(Fast Fourier Transforms, FFTs)进行高度并行化且高效的训练。然而,这种传统状态空间模型(SSM)的一个关键局限性在于,其参数

是固定的且与输入数据无关,使其成为一个线性时不变(Linear Time-Invariant, LTI)系统。这一特性限制了其建模复杂、依赖内容的动力学行为的能力,而Mamba中的选择性机制正是为解决这一挑战而设计的。

视觉状态空间架构(Vision Mamba, VMamba)提出了一种专为处理基于图像的输入而设计的视觉状态空间组件[21]。实现这一适应性的核心创新是2D选择性扫描(2D Selective Scan, SS2D)机制,该机制在分割后的图像块上采用四种不同的扫描模式。这些多样化的遍历方式使该架构能够保留复杂的空间关系,而这些关系在将图像转换为一维序列表示时通常会退化。通过保持固有的2D结构并引入方向偏好,SS2D增强了模型有效表征空间信息的能力。

3 SSMs的可解释性基础

在控制理论中,可控性(Controllability)指的是将系统状态驱动至任意期望值的能力。作者重新利用这一概念,用于量化每个输入 Token (token)或图像块(patch)的“调控能力”或影响力,并引入一种名为影响得分(influence score)的度量方法。影响得分定义为给定 Token 或图像块对最终输出所产生的影响程度。作者将问题形式化定义如下:

给定一个处理输入序列

的 SSM 模型,作者旨在为每个空间 Token 或位置

计算一个影响得分

,该得分用于量化:(1) 位置

处的输入对隐藏状态演化的控制程度;(2) 这种控制在输出空间中的可观测性;(3) 所有状态维度和扫描方向上的累积效应。作者提出了三种不同的影响得分形式。

3.1 初始公式化:可控制性理论的直接应用

将可控性理论最直接地应用于解释SSM(状态空间模型)时,涉及量化输入

对系统终态

的影响。在经典控制理论中,能够将最终状态驱动至期望配置的能力正是可控性的定义。因此,一个合乎逻辑的初步步骤是基于输入块到该终态向量的变换映射的幅度,构建一个影响得分。这种方法在数学上具有吸引力,因为它能直接衡量输入对模型最终内部表示的操控能力。为推导这一关系,作者展开状态更新的递推过程:

最终状态

可表示为初始状态

以及所有输入

序列的函数。通过追踪其在状态转移序列中的路径,可以分离出

中与过去输入

线性相关的确切分量:

矩阵乘积

是将输入向量

转换为其对最终状态

贡献的线性算子。因此,一个自然的影响力得分定义为该算子的范数,它量化了沿该动态路径输入的放大或衰减程度。

尽管从经典控制论的角度来看,这种表述在理论上是合理的,但其在深度且稳定的 SSM(State Space Model)中的实际应用揭示了一个关键的涌现特性。在 Mamba 等架构中,状态矩阵

被初始化并设计为保证系统稳定性,这意味着其离散化形式

的特征值模长通常小于或等于 1。当根据公式 (10) 需要计算这些矩阵的长链乘积时,乘积的范数会随着链长

呈指数衰减。作者称这一现象为消失影响 (vanishing influence),它类似于深度循环神经网络中的梯度消失 (vanishing gradient)问题。这导致计算出的得分出现严重的近期偏差 (recency bias):

• 早期序列输入(

):这些输入的变换矩阵涉及多个稳定矩阵的长乘积,导致其范数逐渐趋近于零。因此,模型对序列开头特征的敏感性显著降低。

• 晚序列输入(

):矩阵乘积较短或为空(当

时为单位矩阵),导致范数显著增大。因此,模型似乎对序列末尾的特征表现出过度敏感。

实证分析验证了这一假设,生成的 Heatmap 显示影响得分主要集中于图像的角落,对应于各种2D扫描路径的起点和终点。这一结果实际上是分析方法自身造成的伪影,而非模型基于内容的推理体现。这一关键发现促使作者开发一种更复杂的度量标准,该标准与模型特定的架构特性相一致,特别是其用于分类的全局信息聚合机制。

3.2 对聚合输出的影响(雅可比方法)

衡量对最终隐藏状态

影响的根本性缺陷在于,该状态并非分类器的直接输入。VSSM 几乎普遍在最终的 SSM 层之后采用全局平均池化(Global Average Pooling, GAP)层。GAP 层对所有

个序列步骤( Patch )的输出向量

计算均值,从而生成一个单一的、固定尺寸的特征向量

,该向量随后被输入到最终的线性分类头中。

首先定义状态传播。在任意步骤

的状态

是先前状态

(其中

)以及中间输入的函数:

偏导数

给出了将输入

的变化映射到未来状态

变化的线性变换:

类似地,通过应用链式法则,可以求得

对输出

的影响:

对于

的特殊情况,影响是直接的(不经过 A):

假设前馈矩阵

可忽略或为零(在这些架构中较为常见),则上式简化为

。从时刻

所有输出的雅可比矩阵的范数(作者使用 Frobenius 范数,

)之和,即为输入

的总影响:

展开后得到作者最终的详细公式:

直接影响(

)衡量了输入

对其对应输出

的即时影响。

:该矩阵将输入块

转换为隐状态

的变化。

的范数越大,表示输入越显著,能够强烈扰动系统状态。

:该矩阵将隐藏状态

读出,以生成输出

的范数越大,表示当前状态对输出越重要。

乘积

表示在步骤

的完整瞬时输入-输出路径。该项确保每个 Patch 都具有基础的影响得分,从而防止早期 Patch 出现“影响消失”问题。

:这是状态转移矩阵,描述了由

引起的初始状态扰动如何随时间在系统记忆中演化并传播。

• 整个项

是一个线性算子,用于将时间

的输入映射到未来时间

的输出。该求和机制有效缓解了近期偏差问题。

对于一个较早的片段

,其对任意单个远距离输出

的影响会因衰减而减弱,但它有机会影响大量后续输出,这些贡献的总和可能非常显著。下述算法展示了如何计算影响得分。

3.3 基于Gramian的影响得分(Gramian方法)

根据经典控制理论,有限时间区间

上的可控制性Gramian 可以计算为:

其中,

为对称半正定矩阵。从物理意义上理解,矩阵

表征了可达状态的能量。换句话说,若

满秩,则任意状态

均可到达,且

的特征值反映了在不同方向上到达各状态所需的能量大小。

对于稳定系统(

),作者可以取

可以通过求解以下连续李雅普诺夫方程得到:

实际上,在许多 SSM(状态空间模型,State Space Model)的实现中,矩阵

被假设为对角矩阵。在这种情况下,Gramian 矩阵变为:

作者可以将其重写为按状态、按元素和按位置

的形式,如下所示:

现在,作者对上述内容按可观测性进行加权,得到:

最后,作者在状态维度上求和,并在内部通道上取平均:

其中

为内部维度(扩展因子 × 模型维度)。最终得分

具有明确的语义解释:

• 高分:位置

的 Patch 对状态动态具有强控制作用(

较大),动态过程具有持久性(

接近 1),且这些状态在输出中具有高度可观测性(

较大)。

• 低分:该 Patch 的影响较弱(

较小)、衰减迅速(

较小)或可观测性低(

较小)。

这与衡量成对 Token 交互的 attention mechanism 不同。作者的可控性分数捕捉了状态空间的影响,即 Token 块如何控制隐藏表示的时间演化。

两种分析方法之间的主要理论区别在于它们对状态转移矩阵

的基本假设不同。基于 Gramian 的方法本质上依赖于对角化的

。正是这一假设使得可以通过闭式、逐元素的解

计算可控性 Gramian

。这种简化在计算上非常高效,但无法应用于非对角状态矩阵的系统,因为后者需要求解完整的、复杂的 Lyapunov 方程。

相比之下,基于雅可比(Jacobian)的方法是一种理论上通用的方法,其根本上并不要求

为对角矩阵。该方法通过计算传播效应,精确追踪输入

对未来输出

的影响,即:

对于非对角系统,状态传播过程

将通过完整的矩阵乘法正确计算,从而准确建模所有状态维度之间的复杂交互。

4 医学图像分类的实验评估

4.1 数据集与模型

作者采用了 MedMamba 架构 [20],这是一种用于医学分类的前沿模型,在多个数据集上的实验中表现出优于多种基准方法的性能。作者在三个具有不同特征的数据集上训练该模型,以评估所提出方法的泛化能力。所使用的数据集如下:

乳腺X线摄影:使用了CMMD数据集,该数据集包含诊断性乳腺X线图像[22]。乳腺X线图像为灰度且高分辨率,诊断特征由细微变化决定。基于可控性的分析应能使作者评估模型识别和捕捉放射科医生会 Token 区域的能力。此外,通过将特定区域的特征与正常区域的特征进行比较,可能检测出这些细微变化和异常。模型还需识别出用于比较的相关正常组织。

皮肤科:作者使用了来自 MedMNIST 的 DermaMNIST 数据集进行皮肤病变分类 [23, 24]。该数据集包含富含纹理和颜色信息的 RGB 图像。ABCDE 原则(不对称性、边界不规则性、颜色变异、直径以及演变)是评估和诊断的主要依据。

血液学:本研究使用的第三个数据集是来自MedMNIST的BloodMNIST,包含血细胞的显微图像[23, 24]。这些图像中存在密集且重复的结构(细胞),其形态差异细微。模型需要根据细胞结构有选择性地关注异常细胞,并抑制正常细胞带来的冗余信息。

4.2 结果

作者评估了基于雅可比(Jacobian)的方法,因为它更具普适性,且不包含基于格拉米安(Gramian)模型的假设,即对角矩阵

。作者分析了 Mamba 模型在不同图像扫描方案下的可控性模式演化、影响得分分布,以及影响得分的更详细分析。

随着网络深度的增加,模型开始表现出空间选择性,较高的可控性分数逐渐集中在具有诊断意义的区域。在皮肤科图像中,这一转变表现为特征从捕捉广泛的皮肤纹理,逐渐转变为精确地定位病灶边界和色素分布模式。

到第三层时,病灶边缘处出现清晰的分界,表明模型已学会优先关注对黑色素瘤分类至关重要的形态学边界。类似地,在乳腺X线图像中,注意力从广泛的纤维腺体组织逐渐演变为聚焦于脂肪-组织界面,最终集中于异常肿块周围的纤维腺体区域。热力图与放射科医生在诊断评估过程中关注的临床相关区域的契合度不断提高。

在血细胞图像中,同样观察到这种分层细化过程:早期层在多个细胞间均匀分配注意力,而深层则根据诊断重要性选择性地增强单个细胞或细胞簇。

这一演进过程表明,Mamba 的选择性状态空间机制自然实现了粗粒度到细粒度的注意力精炼策略,类似于卷积网络中的感受野层次结构,但其通过时间动态而非空间卷积实现。重要的是,尽管存在这种普遍的层次化模式,每种成像模态仍表现出独特的可控性特征,反映了特定领域的诊断特征。

在皮肤科图像中,可控性图谱揭示了对颜色异质性和边界不规则性的强烈加权——这是黑色素瘤诊断的关键指标。模型在后期层对病灶边界的强调,进一步证明了其提取相关诊断特征的能力。

在乳腺X线摄影中,热力图表明分类主要由密度分布模式驱动,模型最初检测到纤维腺体组织和脂肪组织,随后将注意力转向可疑的高密度区域。到第3层时,最具影响力的图像块聚集在异常区域周围,验证了模型已学习到对乳腺X线解读具有临床意义的模式。

5 潜在应用

5.1 计算机视觉应用

基于可控性的可解释性框架为超越医学影像的视觉系统发展开辟了众多新途径,涵盖自动驾驶系统、多媒体分析以及模型安全性等领域。其独特的能力在于能够通过时序动态追踪信息流,使其成为理解现代视觉架构的基础性工具。

5.1.1 视频理解与时间推理

在包括动作识别、事件检测和视频字幕生成在内的视频分析任务中,时间依赖性从根本上决定了模型的预测结果。与将每一帧独立处理并事后聚合其贡献的帧级注意力机制不同,作者的状态空间方法可被扩展,并能直接衡量信息在时间序列中的传播过程。可控性框架能够揭示哪些帧具有重要性,以及早期视觉线索如何通过隐藏状态级联影响最终决策。例如,在动作识别任务中,可控性分析可以精确识别动作从准备阶段过渡到执行阶段的时刻,量化该关键帧对后续状态演化及预测置信度的控制强度。

时间传播度量

提供了一种自然的时间影响衰减度量,能够揭示模型是否合理地权衡了近期帧与历史帧的重要性。这一能力解决了视频理解中的关键问题:模型是否存在过度的近期偏好,过分强调最后几帧?它是否能够正确识别并保持数秒前语义关键时刻的影响?此类分析可提升视频摘要性能,通过识别对下游任务影响最大的帧;

增强时间动作定位能力,通过测量动作边界处的状态可控性;并优化视频压缩策略,保留高可控性帧的同时对低影响区域进行高强度压缩。

5.1.2 自动驾驶与安全关键感知

在自动驾驶系统中,基于SSM(State Space Model)的感知模型需处理来自摄像头、LiDAR和雷达的连续数据流,而可解释性在法律上是部署的强制要求。作者的可控性框架通过基于动力系统理论的机制性解释,而非启发式的事后近似,满足了安全关键领域对可解释AI的监管要求。当自动驾驶车辆做出关键决策(如紧急制动、变道或避让行人)时,可控性映射能够识别出对导致该决策的隐藏状态演化影响最显著的空间区域(如行人位置、邻近车辆轨迹、道路边界)以及时间帧(如行人刚离开人行道的瞬间)。

这种透明性使工程师能够验证模型是否关注因果相关的特征,而非虚假相关性。此外,通过比较不同天气条件、光照场景和交通密度下的可控性图(controllability maps),开发者可以识别出模型在分布变化下不恰当地重新分配注意力的领域偏移(domain shift)脆弱点。在VMamba架构中,扫描方向分析在自主感知任务中尤为突出,因为不同的扫描方向可能捕捉到结构化驾驶环境中不同的空间关系。例如,前后扫描自然与道路几何形状和交通流方向对齐,而横向扫描则可能更好地捕捉相邻车道车辆之间的横向关系。可控性分析能够量化这些方向性偏差,从而为设计扫描增强策略或自适应扫描策略提供依据,以优化驾驶场景下的空间注意力分配。

5.1.3 对抗鲁棒性与模型安全

深度学习模型的安全性与鲁棒性可以通过在对抗攻击下通过可控制性分析(controllability analysis)来严格评估。这一应用将可解释性从一种诊断工具转变为一种用于理解脆弱性机制的法医学工具。设

为一个良性图像,

为其在对抗扰动下导致误分类的版本。通过计算二者各自的可控制性图谱

,并分析差异图谱

,可以精确定位攻击对状态动力学产生最大影响的具体空间区域及层级结构。该分析以前所未有的精度揭示了对抗攻击的利用机制。传统的基于梯度的显著性方法仅能显示攻击扰动像素的位置,而可控制性分析则进一步揭示了这些扰动如何通过状态空间动力学传播,进而破坏隐藏表示。

5.1.4 遥感与大规模空间分析

在卫星与航空影像分析中,基于SSM(State Space Model)的模型处理多光谱、高光谱或地球观测数据的时间序列,应用于土地覆盖分类、变化检测、灾害评估以及农业监测等任务。可控性框架解决了该领域特有的可解释性挑战,其中输入数据涵盖多个光谱波段(可见光、红外、雷达)以及时间序列观测(每日、季节性时间序列)。通过计算各波段的可控性分数,作者可以识别出对每个任务预测最具影响力的光谱通道。这种光谱影响分析有助于指导最优传感器选择与数据融合策略。

5.2 语言模型应用

尽管作者的实验聚焦于视觉任务,但可控性框架可直接扩展至基于SSM(State Space Model)的语言模型。该框架提供了一种系统化的方法,用于衡量 Token (tokens)、段落(passages)以及推理步骤对状态动态的影响,从而为长上下文处理、 Prompt (prompt)设计、推理过程和语义 Anchor 定(grounding)提供机制层面的深入理解。

5.2.1 长上下文理解与信息检索

长上下文SSM(如Mamba)能够处理远超典型Transformer限制的文档或对话。可控性分数(controllability scores)提供了一种系统化的方法,用于识别哪些 Token (tokens)或段落真正影响模型状态的演化,从而直接应对“中间迷失”(lost in the middle)等现象。通过同时衡量即时影响和传播影响,可控性能够区分真正塑造模型预测的上下文,与仅表面相关或仅因位置接近而看似相关的文本。

该分析实现了更精确的推理时优化。与基于启发式截断或嵌入向量过滤的方法不同,基于可控性的剪枝方法保留了对状态具有显著控制作用的片段,同时移除影响较小的内容。在检索增强生成(retrieval-augmented generation)任务中,该框架能够明确指出哪些检索到的段落真正引导了模型的推理过程。同时,它也能揭示模型依赖于风格连贯但事实性较弱的来源,而非权威材料的失败案例。

5.2.2 Prompt 工程与上下文学习

可控性将 Prompt 工程从一种试错过程转变为以度量为导向的流程。通过为指令、示范和 Query 打分,从业者可以量化哪些示例真正影响模型的内部状态,哪些是冗余的。这支持系统性地选择能最大化对目标 Query 影响的示范,同时在保持任务性能的前提下减少 Prompt 长度。分层可控性揭示了 Prompt 在层级结构中的处理方式:早期层通常捕捉示范之间的广泛模式,而深层则强化语义上对齐的示例。对于思维链(Chain-of-Thought, CoT) Prompt ,通过对比有无推理链时的可控性,可以识别出哪些推理步骤真正 Reshape 了模型的内部轨迹。这使得能够通过剪枝无效步骤、扩展高影响力步骤或重新排列推理顺序来优化CoT Prompt ,从而提升对最终预测的影响。

5.2.3 多步推理与代码生成

复杂推理,例如数学问题求解,要求模型在多个步骤中保持并整合信息。可控性分析通过测量每个前提或中间步骤对后续结论的影响,提供这一过程的时间映射。这揭示了推理 Bottleneck ,例如早期信息衰减过快,或某些步骤对最终解法贡献甚微,从而指导模型设计或 Prompt 策略的针对性改进。在代码生成与程序合成任务中,可控性分析追踪函数签名、类型声明以及先前代码块之间的依赖关系。高影响力元素揭示了模型在生成新代码时隐式重构的数据流。这一洞察对调试极具价值:当模型生成错误代码时,可控性映射能够突出 Prompt 词或先前上下文中哪些部分最强烈地驱动了错误生成,从而指向被误解的指令或早期代码中的不一致之处。

5.3 多模态与跨域应用

该可控性框架可扩展至多模态和跨域状态空间模型(SSM)应用,为解释异构输入如何影响状态动态提供统一的数学工具。通过量化不同模态(视觉、语言、音频和时序信号)间的信息 Stream ,该框架揭示了模型如何整合并优先处理不同来源的输入。这种与架构无关的表述方式,能够在需要复杂推理、信息融合或长时程依赖的任务中实现一致的可解释性。

在视觉-语言建模、语音与声学分析、科学预测以及生物序列处理等多模态任务中,可控性(controllability)揭示了驱动预测的底层机制。它能够识别多模态融合中的主导模态,突出音频或时间序列中的显著时间区域,并精确定位基因组与蛋白质数据中具有生物学或结构关键性的子序列。这些影响模式有助于诊断诸如融合不完整、对先验知识过度依赖、虚假相关性或长程依赖性丢失等失败现象。该框架同样适用于强化学习与实时系统,其中可控性可揭示哪些动作对未来的状态轨迹影响最为显著,并支持可解释的时间信用分配。其计算效率与状态维度和序列长度呈线性关系,使得在不修改模型架构的前提下,即可在生产环境中实现实时可解释性。通过为所有基于SSM(State Space Model)的领域提供一种统一、可扩展的信息流分析方法,可控性为下一代序列模型的统一可解释性奠定了基础。

6 结论与未来研究方向

本文提出了一种基于可控性的分析方法,构建了一个原则性强、数学严谨的框架,用于解释状态空间模型(State Space Models, SSMs),填补了作者对这一快速发展的架构范式理解中的关键空白。该架构有望在语言、视觉、时间序列及多模态领域 Reshape 人工智能。通过将方法建立在经典控制理论基础之上,而非依赖梯度近似或注意力启发式方法,作者提出了一种根本性的可解释性新方法,能够直接量化输入元素对SSMs内部状态动态的控制能力。

作者提出了两种互补的公式,以在通用性与计算效率之间取得平衡:

(1) 基于雅可比(Jacobian)的方法,通过完整的状态传播链来度量对聚合输出的影响,适用于任何状态空间模型(SSM)架构,包括具有非对角或结构化状态矩阵的模型;

(2) 基于格拉米安(Gramian)的方法,利用李雅普诺夫(Lyapunov)方程的解析解,针对状态矩阵为对角的系统,通过闭式求解实现显著更快的计算速度。雅可比方法提供了最大的灵活性和广泛适用性,支持任意的SSM变体、混合架构以及自定义状态参数化,因此是探索性分析和新型架构设计的首选方法。格拉米安方法虽然要求状态矩阵为对角形式(这一假设在大多数现代SSM中成立,如S4、Mamba及其衍生模型),但通过避免迭代矩阵乘积,实现了更高的计算效率,因而特别适用于大规模部署和实时可解释性应用场景。

在三种多样化的医学影像模态——乳腺摄影、皮肤病学和血液学——上进行的广泛实证验证表明,VSSM(状态空间模型)天然具备层次化注意力精炼能力,能够逐步将注意力从分散的低层特征聚焦至具有语义意义的诊断模式。作者的分析揭示了与临床诊断标准相一致的领域特异性可控性特征,验证了扫描策略对空间注意力的影响,并揭示了状态转移过程中信息传播的时序动态特性。

超越医学影像领域,作者提出了一个全面的可控性分析愿景,涵盖计算机视觉(自动驾驶、视频理解、对抗鲁棒性)、自然语言处理(长上下文建模、 Prompt 工程、推理)以及跨领域应用,确立了该框架作为SSM(状态空间模型)时代基础可解释性范式的重要地位。

作者设想,基于可控性的可解释性将成为理解现代序列模型机制的一种通用且高分辨率的分析工具。可控性分析将状态空间模型(SSM)从黑箱函数逼近器转变为可透明化的动力系统,其信息 Stream 可被精确测量、诊断与优化。这种透明性在模型调试、高风险领域中的安全验证、合规性审查以及基于机制理解而非经验试错的合理架构设计方面具有直接的实际意义。尽管作者的工作确立了可控性分析作为SSM可解释性的一种强大且理论基础扎实的工具,但仍存在若干重要局限性,以及若干值得深入探索的激动人心的研究方向:

非线性动力学与层间交互:Gramian 方法假设 SSM 动力学具有局部线性特性,这一假设在每个 SSM 层内的线性状态转移

下严格成立。然而,现代深层 SSM 架构在层间引入了非线性变换——激活函数(SiLU、GELU)、归一化方法(LayerNorm、RMSNorm)、门控机制以及残差连接,这些非线性操作从根本上改变了信息 Stream 方式,而这些特性无法通过逐层线性分析来捕捉。将可控性框架扩展至能够涵盖这些非线性变换,构成了一个重大的理论挑战。潜在的解决途径包括:

(1) 采用微分几何方法,对非线性动力系统在流形上的可控性进行刻画;

(2) 在当前状态轨迹附近进行高阶泰勒展开,以近似局部非线性效应;

(3) 通过扰动分析进行经验 Gramian 计算,直接测量在非线性动力学下状态的可达性。若能成功将非线性因素纳入分析框架,将显著提升对复杂、深度堆叠的 SSM 架构的建模保真度。

通过网络深度的端到端归因:当前的分析方法在每一层独立计算可控性,生成逐层的影响图,从而突出特征处理的层次化结构。一个自然的下一步是将这些影响分数在整个网络中传播,以从原始输入到最终输出获得单一的端到端归因图。

实现这一目标需要显式建模残差连接、池化操作以及其他跨层交互中的信息流,这对基于SSM(State Space Model)的架构而言是一个本质上非平凡的挑战。尽管这一问题在概念上与Transformer中的注意力传播(attention rollout)相关,但SSM的序列性和状态依赖特性引入了额外的复杂性。有前景的研究方向包括适配诸如逐层相关性传播(layer-wise relevance propagation)等技术,或开发尊重状态动态的SSM专用传播规则,从而可能实现统一的全局可控性度量。

时间因果分析与预测可解释性:对于具有固有时间结构的序列数据(如视频流、传感器时序数据、对话式交互),现有方法仅提供静态的、每时间步的影响得分,用于衡量输入对最终输出的累积影响。

更丰富的分析应能捕捉时间因果影响:即时间

的输入如何具体影响未来时间

的输出,从而支持因果推理与预测可解释性。这需要求解有限时域下的时变 Gramian 矩阵,尽管计算成本更高,但理论上是可解的。该方法将使预测任务、早期预警系统以及多步推理链中的预测可解释性成为可能,其中理解时间因果关系至关重要。

点击上方卡片,关注「AI视界引擎」公众号

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论