SST-DUNet:融合智能移位窗口注意力与密集UNet的fMRI 自动化框架 !

大模型向量数据库机器学习

点击下方卡片,关注「AI视界引擎」公众号

( 添加时备注:方向+学校/公司+昵称/姓名 )

picture.image

picture.image

颅骨剥离是磁共振成像(MRI)流程中常见的预处理步骤,通常在功能磁共振成像(fMRI)等流程中手动执行。该手动过程耗时且依赖于操作员。由于脑部几何形状、分辨率和组织对比度的变化,自动化此过程对于临床前数据来说具有挑战性。尽管目前存在用于MRI颅骨剥离的方法,但它们通常难以处理临床前fMRI数据中低分辨率和变化的切片尺寸。

本研究提出了一种名为SST-DUNet的新方法,该方法集成了基于密集UNet的架构和基于智能Swin Transformer(SST)的特征提取器,用于fMRI颅骨剥离。SST中的智能移位窗口多头自注意力(SSW-MSA)模块被用于替换Swin Transformer(ST)中的基于 Mask 的模块,从而能够在关注脑部结构相关依赖关系的同时学习不同的通道特征。

这种修改使模型能够更好地处理fMRI颅骨剥离的复杂性,如低分辨率和可变的切片尺寸。为解决临床前数据中的类别不平衡问题,采用了结合Focal和Dice损失的复合损失函数。该模型在老鼠fMRI图像上进行了训练,并在三个内部数据集上进行了评估,Dice相似度得分分别为98.65%、97.86%和98.04%。

通过SST-DUNet模型自动颅骨剥离获得的fMRI结果与手动颅骨剥离的结果在种子分析和独立成分分析中高度一致。这些结果表明,SST-DUNet可以有效地替代老鼠fMRI分析中的手动脑部提取。

  1. 引言

临床前fMRI分析在理解动物模型中的大脑功能和神经系统疾病方面发挥着关键作用,旨在改进人类临床研究[1]。通过研究功能连接、大脑活动模式和神经动力学,临床前fMRI使研究行人能够在受控环境中研究疾病、药物和干预措施的影响[2]。然而,fMRI分析的准确性和可靠性在很大程度上取决于预处理流程,该流程对于准备临床前分析数据至关重要。三维颅骨剥离是关键的预处理步骤之一,通过从 Head 三维MRI图像中提取大脑图像。该过程的输出是一个三维二进制 Mask ,用于区分连续的大脑与 Head 的其他部分。手动提取大脑被认为是颅骨剥离的常用方法,涉及专家手动从 Head 轮廓大脑图像[3]。尽管手动方法可以产生稳健的结果,但它具有主观性、劳动密集型和耗时性[4]。为解决这一问题,已开发出半自动化或全自动化方法用于颅骨剥离。开发此类算法不仅提高了数据质量,还提高了研究结果的再现性和一致性,推动了神经科学研究的进步。

在与人脑相关的临床MRI研究中,已经提出了多种自动颅骨剥离算法,并得到了广泛应用[5, 6, 7, 8, 9]。这些方法分为两大类:传统方法和基于学习的方法[10]。然而,由于大脑和头皮几何形状、图像分辨率和图像对比度的差异,这些方法不适用于临床前应用。

在临床前颅骨剥离方面,最突出的传统算法包括由Oguz等人提出的快速自动组织分割(RATS)[11],以及由Lohmeier等人提出的基于模板的方法。

[12] Liu等人提出的形态学过滤后选择形状描述符极端区域(SHERM)[13],以及MacNicol等人提出的antsBrainExtraction(antsBE)[14]。上述颅骨剥离方法中常见的约束在于其性能受脑部大小、形状、纹理和对比度等因素的影响而具有可变性。近期,Eddin等人提出了基于图谱的兽医图像脑部提取(VIBE)算法,用于在多对比度动物MRI上提取脑部[15]。然而,该方法仅在猫和狗脑部MRI数据上进行了测试,尚未在其他动物脑部数据集(如大鼠和小鼠)上进行评估。

机器学习领域的进展为临床前颅骨剥离引入了潜在的自动化方法。Roy等人[16]提出了一种基于改进的Google Inception[17]的卷积神经网络(CNN)架构,使用多个图谱对二维啮齿类动物脑部MRI图像进行建模。随着深度学习的进步,更多先进的CNN架构被引入用于语义分割。其中,广泛使用的深度CNN模型UNet在该任务中展现出显著的有效性。Thai等人[18]利用二维UNet对小鼠的弥散加权图像进行颅骨剥离。Hsu等人[3]提出了一种基于卷积深度学习的颅骨剥离方法,使用UNet对二维MRI数据进行处理。MRI图像块被随机裁剪以创建脑部 Mask ,该 Mask 作为二维UNet架构的输入。通过将解剖学专家手动绘制的脑部 Mask 与模型生成的 Mask 进行比较来评估模型的性能。Deo Feo等人[19]引入了一种多任务UNet(MUNet),专为颅骨剥离和区域分割设计。模型的训练和验证使用了来自小鼠的解剖学MRI图像。最近,Liang等人[20]提出了一种使用U

-Net对大鼠脑部MRI进行颅骨剥离的算法。Chang等人[21]将RUNet应用于缺血性中风后大鼠MRI的颅骨剥离。此外,Porter等人[22]将二维UNet应用于MRI啮齿类动物脑部的颅骨剥离。尽管这些方法取得了显著的成功,但一个普遍的局限性是它们依赖于二维MRI数据,而二维数据本质上缺乏三维成像中存在的空间关系。这种限制可能会影响它们在fMRI数据集上的准确性和泛化能力,因为在fMRI数据集中,空间上下文至关重要。

徐等人 [23] 提出了一种基于3D UNet框架的方法,该方法使用3D卷积核来预测 Voxel 块上的分割结果。该方法已用于训练和评估3D Voxel 大鼠脑MRI数据的脑提取。徐等人 [24] 提出了一种基于逆空间归一化和深度卷积神经网络模型的方法,用于小鼠正电子发射断层扫描(PET)的脑提取。这些方法在结构MRI和PET数据上表现出成功,但在功能MRI(fMRI)上仍存在挑战。它们未能解决fMRI特有的挑战,包括低分辨率数据、小脑区和前脑切片中切片尺寸的变化。3D UNet也被阮等人 [25] 用于小鼠解剖和功能MRI分析的颅骨剥离。然而,在处理前脑和后脑切片中存在的小脑区时,其性能受到限制,常导致不完整或不准确的脑提取。这一挑战源于3D UNet无法充分捕捉这些区域中的精细空间细节,而这些细节对于临床前fMRI数据的精确颅骨剥离至关重要。

Transformer模型最近被应用于医学影像领域,以增强特征提取,从而提高分割精度[26][27][28]。Lin等人[29]采用带有Swin Transformer[30]的3D UNet框架进行啮齿类动物解剖MRI颅骨剥离。他们的模型基于Swin-UNETR[31],用于MRI临床前流程。然而,这种方法需要对临床前fMRI进行改进,因为fMRI通常受到噪声和低分辨率的影响。对于这项应用来说,准确提取全局和局部特征至关重要。

在本文中,作者提出了一种基于智能Swin Transformer(SST)的模型,该模型由Fu等人[32]为2D医学图像开发,旨在解决标准Swin Transformer在临床fMRI颅骨剥离中的局限性。传统Swin Transformer中的 Mask 主要保留邻近像素之间的依赖关系,而yinqing-SST-DUNet_2504通过考虑每个切片的功能意义,将 Mask 纳入了有价值的远距离交互。这种改进确保了yinqing-SST-DUNet_2504能够捕捉局部和全局空间关系,这对于临床fMRI数据的准确脑部提取至关重要。作者提出了一种改进的SST,以简化预处理流程并提高临床fMRI研究的效率。yinqing-SST-DUNet_2504设计为轻量级、快速且计算高效,确保其在不同fMRI研究中的适应性和鲁棒性。通过引入结构改进,yinqing-SST-DUNet_2504降低了资源需求,使其适用于资源受限的环境。SST被用作3D密集UNet结构的编码器,以应用密集连接层,重复使用特征并改善梯度流,这使其在捕捉图像细节方面非常有效。该架构将信息从早期层传播到深层,并从输入数据中捕获详细特征。临床数据集在不同脑区(前、中、后)的切片尺寸上往往存在不平衡,这对颅骨剥离算法构成挑战。为解决此问题,作者采用了一种结合Dice损失[33]和Focal损失[34]函数的综合损失函数,以指导参数优化而不增加计算成本。这种方法防止模型仅关注整个图像的像素精度,确保边界像素和其他关键区域也能被准确预测。它有助于处理与不同切片尺寸相关的非均匀分布和类别不平衡的分割挑战。因此,基于SST的3D密集UNet模型在临床fMRI分析中提供了一种鲁棒且准确的颅骨剥离方法,并提高了网络区分脑组织和非脑组织的能力。比较评估表明其具有最先进的性能,并适用于临床应用。

这项工作的贡献可以总结如下。

  1. 作者开发了一种用于临床fMRI的新型脑脊液剥离方法,该方法结合了密集3D UNet和基于SST的特征提取器。

  2. 作者采用Dice损失函数和Focal损失函数的组合,以提高在具有不同切片尺寸的嘈杂、低分辨率fMRI数据中的准确性和鲁棒性。

  3. 作者证明了所yinqing-SST-DUNet_2504在脑脊液剥离质量、Dice相似度得分以及fMRI下游任务方面优于现有技术。

  4. 提出方法


2.1. 智能Swin Transformer

作者应用了智能Swin Transformer(SST)[32],该模型最初是为2D医学图像分割而提出的。在yinqing-SST-DUNet_2504中,SST被用于提取用于临床前fMRI颅骨剥离的特征,如图1所示。Swin Transformer [30]由两个连续模块组成:多自注意力(W-MSA)和移位窗口自注意力(SW-MSA)。在3D MRI数据的上下文中,这些模块被扩展以捕获不同脑区之间的空间和体积特征。W-MSA主要关注局部信息,用于对3D窗口内的 Voxel 级交互进行建模,确保保留精细的解剖结构。SW-MSA捕获全局交互,被适配以处理跨窗口的3D特征体积依赖关系。然而,在标准Sw-MSA中,自注意力矩阵的 Mask 在所有通道中保持固定,限制了利用多样化特征表示以实现精确颅骨剥离的能力。为解决这一问题,基于智能 Mask 的SST根据每个通道的特定特征动态确定其 Mask 。这实现了 Voxel 级和区域交互的自适应学习,有效区分脑组织和非脑结构。通过利用通道自适应注意力,模型能够增强不同MRI对比度下的特征提取,提高脑提取精度,同时保留解剖细节。

picture.image

SSw-MSA(智能位移窗口多头自注意力)的主要功能在图2中对一个切片进行了说明。蓝色框的运动代表了位移窗口。橙色框表示用于计算自注意力分数的区域,该区域受智能 Mask 在特定通道内的约束。每个通道都有不同的 Mask ,此处仅显示其中一个(具体而言,负责捕获前景像素之间交互的通道)。

picture.image

自注意力模块由以下公式定义:

其中,

分别是 Query 矩阵、键矩阵和值矩阵,维度为

是输入体积中的块数。

是键/ Query 向量的维度。

是特定于通道的 Mask ,用于学习调整每个通道的自注意力权重。

智能 Mask 通过在各个通道中创建不同的 Mask 来利用通道特征。SSw-MSA通过保留精确的上下文数据并忽略无用的交互来改进长距离依赖关系。SSM-MSA的细节显示在图1的右侧。W-MSA和SSw-MSA提供局部和全局信息,专注于通道 Level 的特征,这与Swin Transformer不同。表示Swin Transformer块的公式,即图1左侧的结构如下:

其中

是第

(LayerNorm)的输出

代表正则化

表示多层 FFN

分别表示窗口自注意力机制和智能移位窗口自注意力机制

2.2. 网络架构

作者采用带有SST的密集UNet架构,用于作者提出的SST-DUNet预临床fMRI颅骨剥离方法。密集UNet最初由Kolavrik等人[35]为人类大脑和脊柱分割而开发。在密集UNet架构中,引入了层与层之间的密集连接,这意味着每一层不仅接收来自其前一层的信息,还接收来自所有先前层的信息。这种密集连接使模型能够重用不同尺度和抽象层次的特征,这对于处理预临床数据特别有利。预临床MRI图像可能缺乏精细细节,而传统的UNet架构可能难以捕捉和保留对准确颅骨剥离至关重要的特征。密集UNet中的密集连接促进了信息在整个网络中的 Stream ,从而实现更好的特征重用,并增强了模型提取相关细节的能力。密集UNet架构以其处理局部和全局上下文的能力而闻名,从而带来更准确和鲁棒的分割结果。

SST-DUNet架构如图3所示。密集UNet架构通过在3D UNet架构的核心结构中集成额外的互连而构成。密集和残差互连分别以蓝色和绿色在图3中显示。如图所示,一个

的图像输入到SST和密集UNet的编码器部分。第一层将通道数增加到48。存在一个块嵌入、三个SST块和三个块合并,每次将特征下采样到一半。这四个SST输出层的通道数分别为48-96-192-384。这四个尺度的特征输入到网络的解码器部分。该架构的特点是采用自动编码器设计,包含五个下采样块和五个上采样块,并通过网络底部的桥接块连接。每个下采样块通过最大池化层将特征尺寸减半。在每个上采样块开始时,通过步长为2的转置卷积层将特征尺寸加倍。类似地,解码器模块以相反的顺序使用相同数量的层。编码器和解码器的每个卷积层(除最后一层外)后都跟一个泄漏修正线性单元(LeakyReLU)激活函数。最后一层应用Sigmoid激活函数。Sigmoid函数用于生成表示概率的输出值,使网络能够生成二值脑脊液剥离 Mask 。

picture.image

2.3. 组合损失函数

在训练不平衡数据上的深度网络的一个关键步骤是应用适当的损失函数。与常见的结合交叉熵(CE)损失[36]和Dice损失[33]函数的方法不同,后者主要针对整个图像的整体分割精度,Focal loss[34]和Dice损失函数的集成优先考虑难以分类的像素,例如边界处的像素或跨不同尺度的像素。这种策略使SST能够有效识别和利用跨不同通道的高质量长程依赖关系,从而提高模型的分割精度。组合损失

计算为Dice损失

和Focal损失

的加权求和,其公式如下。

用于控制Dice损失和Focal损失对总损失的相对贡献。

Dice loss是一种广泛采用的指标,用于评估预测(X)与真实(Y)分割区域之间的不相似性:

Dice损失在模型最大化预测与真实分割区域之间的重叠时被最小化。然而,由于Dice损失的线性特性,存在局限性。为解决这些缺点,作者应用Focal损失函数,该函数通过在交叉熵(CE)损失

中添加一个指数权重项获得。CE损失和Focal损失函数的计算方式如下:

其中,

指当前像素的分类属性。

是一个超参数,用于调节对错误分类像素的惩罚强度,通常设置为2。从公式中可以看出,Focal loss 对更可能被错误分类的像素施加更强的惩罚。这种方法有助于解决正负样本之间的不平衡以及类别不平衡问题。

2.4. 实现细节

该模型使用Keras框架,在Nvidia GeForce RTX 4090显卡上使用TensorFlow后端和CUDA进行训练。模型采用组合损失函数,并使用AdamW优化器,参数设置为学习率0.00001,

,批处理大小为2。学习率调度器采用线性预热余弦退火策略,首先进行50个epoch的预热阶段,学习率从低值缓慢上升到目标值。预热后,学习率遵循余弦退火模式,逐渐降低以改善收敛性。

  1. 数据集

在本论文中,作者应用了东北大学转化神经影像中心(CTNI)收集的与七项研究相关的三项内部数据集,共包含280只大鼠。实验使用 Bruker Biospec 7.0T/20-cm USR 水平磁体(Bruker,马萨诸塞州比勒里卡)和 20-G/cm 磁场梯度插入件(ID = 12 cm),该插入件具有 120-s 上升时间(Bruker)。射频信号通过动物固定器内置的四线圈电子设备发送和接收。实验所用雄性 Sprague Dawley 大鼠体重为 325-350 g,购自 Charles River Laboratories(美国马萨诸塞州威尔明顿),饲养在 12:12 小时光暗循环环境中,光照时间为每日 0700 小时,并允许自由摄食和饮水。所有大鼠的获取和饲养均遵循《实验动物护理和使用指南》(美国国立卫生研究院出版物编号 No. 85-23,1985年修订版)的指导原则,并符合美国国立卫生研究院和美国实验动物科学协会的指南。本研究使用的实验方案符合东北大学机构动物护理和使用委员会的法规。

每次成像开始时,使用快速自旋回波增强采集序列(RARE)采集高分辨率解剖数据集(25层;1毫米;视野(FOV)3.0厘米;图像尺寸

;重复时间(TR)2.5秒;回波时间(TE)12.4毫秒;激发次数(NEX)6;采集时间6分钟)。基于任务的fMRI部分的功能图像采用半傅里叶采集、单次激发、涡轮自旋回波序列(RARE-st)采集。单次扫描会采集96×96平面分辨率,每6秒20-25层(TR=6000毫秒;TE 48毫秒;RARE因子36;NEX 1),每10分钟重复100次。静息态功能磁共振成像(rsfMRI)数据在基于任务的fMRI扫描前后采集,采用自旋回波三重激发EPI序列(成像参数:图像尺寸96×96×层厚[长度×宽度×深度],层数在20至25之间变化,取决于大脑大小,TR 1000毫秒,TE 15毫秒, Voxel 尺寸

,层厚1.2毫米,300次重复,采集时间15分钟)。

3.1. 数据预处理

数据预处理对于提升模型的鲁棒性和泛化能力至关重要。所有图像均被调整为

大小。此外,为了增强数据集的多样性并提高模型处理真实世界图像变化的能力,引入了数据增强方法,包括高斯噪声、高斯模糊、亮度和对比度调整、模拟低分辨率以及伽马校正。输入 Voxel 值通过归一化调整至0.0到1.0的范围内。

3.2. 训练与测试数据

在本论文中,作者应用fMRI数据的均值创建了三维MRI数据集。作者应用了5项研究(数据集1),包含260个样本用于训练和测试。为训练模型,作者首先通过随机选择80%的数据创建了一个训练数据集,保留剩余的20%用于最终性能测试。在训练阶段,作者从训练数据集中随机抽取了额外的80%数据,留下剩余的20%用于验证模型的训练。这种训练-验证过程重复了五次以确保数据分布的无偏性。随后,选择平均验证准确率最高的模型作为最终测试模型。为评估模型的泛化能力,作者应用了两项研究,每项研究包含10个样本(数据集2和数据集3)。这些研究未用于训练。

3.3. 数据后处理

生成预测 Mask 后,后处理过程包括保留最大的连通区域,同时丢弃较小的、不连通的区域。这确保了fMRI数据具有连贯且结构上有意义的脑膜剥离输出。通过消除噪声和无关片段,该方法提高了分割精度并保留了解剖完整性。对于fMRI预处理而言,这种方法特别有益,因为准确的脑膜去除对于下游分析至关重要。这种简单有效的策略优化了网络输出,提高了实际应用的可靠性。最终,它确保了最终 Mask 与fMRI数据处理的结构要求相一致。

4 实验结果

为验证yinqing-SST-DUNet_2504的有效性,作者将其与RATS [11](一种常用的传统方法)以及基于深度学习的方法进行了比较,包括3D UNet [23]、UNet-CNN [22]、SWIN-UNETR[31]、SSTrans-Net [32]和RS2-Net [29]。RATS是一种基于强度的传统方法,依赖于区域增长和阈值技术。3D UNet已在Ruan等人 [25]进行的临床前fMRI颅骨剥离研究中得到研究,该研究采用带有 Shortcut 的编码器-解码器结构。UNet-CNN应用了一种基于UNet的改进框架进行特征提取。Swin-UNETR引入了一种基于transformer的方法,结合滑动窗口机制以增强特征提取。SSTrans-Net是一种基于U形Smart Swin Transformer的2D医学分割方法。RS2-Net基于Swin-UNETR用于临床前MRI颅骨剥离。每种方法的参数均根据各自论文推荐的优化参数进行选择。

为了定量评估模型的脑膜剥离性能,作者测量了生成脑图像与手动绘制脑 Mask 之间的相似度,后者作为基准。每个样本的脑 Mask 均通过ITK-SNAP(v3.8.0)手动计算。为提高对比度,使用功能图像的平均文件来区分脑组织和非脑组织。

4.1. MRI图像分析

在本节中,作者介绍了用于颅骨剥离的MRI图像分析方法,重点介绍了使用各种定量指标对所提出方法进行的评估。

4.1.1. 评估指标

作者应用以下评估指标来定量评估所提出模型的性能。Dice系数用于计算两个样本之间的相似度得分。阳性预测值(Positive Prediction Value,PPV)用于计算预测结果中真阳性的比例。采用Hausdorff距离(Hausdorff Distance,HD)对表面距离进行评估,该指标用于测量两个样本集之间的距离。灵敏度(Sensitivity,SEN)用于计算手动颅骨剥离中真阳性的比率。作者用

表示手动颅骨剥离体积的 Voxel 集,用

表示预测体积的 Voxel 集。这些指标的计算方法如下:

其中

,且

表示

之间的欧几里得距离

4.1.2. 结果

进一步支持了yinqing-SST-DUNet_2504在匹配真实情况方面的优越能力。

为验证yinqing-SST-DUNet_2504的一般化能力,作者在两个未见数据集(数据集2和数据集3)上进行了测试。使用数据集1训练的模型被应用于未见数据并进行了评估。表2展示了yinqing-SST-DUNet_2504及其与当前最优方法在数据集2和数据集3上的定量结果。作者报告了作为传统方法的RATS的结果,以及三种基于学习的算法,包括由Ruan等人[25]应用于fMRI颅骨剥离的3D UNet,SSTransNet,以及基于表1结果Dice值最高的RS

-Net。该表报告了所有指标的平均值和标准差。结果表明yinqing-SST-DUNet_2504优于其他方法,并产生了准确的颅骨剥离结果:对于数据集2,Dice值为0.9786±0.0142,HD值为1.7211±0.220;对于数据集3,Dice值为0.9804±0.0131,HD值为1.633±0.215。结果表明,所yinqing-SST-DUNet_2504能够在不同数据集的预临床脑图像上进行颅骨剥离,无需额外训练。

picture.image

picture.image

除了上一节讨论的四个评估指标外,作者还对脑脊液剥离结果进行了显著性分析,以评估yinqing-SST-DUNet_2504与其他方法产生的结果之间的差异。表1和表2中呈现的p值为作者提供了关于这些差异统计显著性的重要见解。通常认为p值低于0.05具有统计显著性,这意味着观察到的差异不太可能是由随机偶然性引起的。在作者的案例中,在所有评估指标中,yinqing-SST-DUNet_2504与其他方法之间的大多数比较的p值都低于0.01,其中一些低于0.05。这个低p值表明存在显著且高度显著的性能差距,证明yinqing-SST-DUNet_2504在所有这些指标上都优于其他方法。然而,对于表1中的一些指标,例如PPV和

SEN、Swin-UNETR、SSTrans-Net和RS2-Net显示出更高的p值。尽管指标值仍然表明yinqing-SST-DUNet_2504表现更好,但差异在统计上并不显著。此外,在表2中,数据集2上SSTrans-Net和RS2-Net的HD和SEN指标显示出更高的p值,数据集3上SSTrans-Net和RS2-Net的SEN和PPV指标显示出更高的p值。

为评估yinqing-SST-DUNet_2504的性能,数据集1测试集中的两个受试者的脑组织剥离结果展示在图4A和B中,显示了大脑中部和后部区域的切片。此外,数据集2和数据集3中一个受试者的单个切片结果分别展示在图4C和D中。如图4所示,RATS倾向于将非脑组织误分类为脑组织,而所有基于深度学习的方法均能有效提取脑组织。图5展示了应用于数据集1的两个fMRI样本的基于深度学习方法的进一步比较,提供了三种不同视角以进行更全面的评估。

picture.image

表3中每层切片的Dice指标提供了对各方法定量的比较。这些结果突显了作者所yinqing-SST-DUNet_2504优于现有技术,并为临床前颅骨剥离提供了可靠的解决方案。

由于fMRI数据本身具有噪声性,作者进行了一项测试,通过添加Rician噪声来模拟噪声。这项测试旨在评估作者的颅骨剥离方法在不同噪声条件下的鲁棒性,并确保其在实际场景中的有效性。为了进一步提升fMRI数据的质量,可以在颅骨剥离之前应用先进的去噪技术。在作者的近期关于fMRI去噪的工作中[37],作者展示了一种有效的方法,能够在保留重要脑结构的同时减少噪声。整合这类方法可以进一步提高颅骨剥离的准确性,特别是在高度噪声的数据集中。作者评估了作者的颅骨剥离算法在不同噪声水平图像上的性能,以验证其可靠性。在这个测试中,作者手动向MRI数据中引入了Rician噪声[38],这是一种人工生成的噪声。Rician噪声在MRI研究中被广泛使用,因为它能够紧密模拟MRI数据中观察到的噪声模式[38]。由于真实的临床前数据通常表现出大约

3%,作者遵循了受Ran等人[38]启发的实验设置,将噪声水平(噪声标准差)从1%到15%以2%的增量进行应用。

模型在不同噪声水平下的性能已在图6中针对数据集1进行了展示。图6A显示了数据集1测试集中一个样本中间切片在1%至9%噪声水平下的脑组织剥离结果。如图6B所示,随着Rician噪声水平的增加,yinqing-SST-DUNet_2504的性能会下降。然而,在1%至7%的噪声水平下,脑组织剥离的Dice系数仍可达到>0.95且高斯差(HD)<3的合适水平。这表明yinqing-SST-DUNet_2504具有容忍噪声的能力,意味着该方法能够有效处理具有广泛信噪比(SNR)质量范围的fMRI数据。

picture.image

4.2. 基于种子的功能连接分析

为进一步比较手动脑提取与所提出的SSTDUNet方法,作者应用了基于种子的功能连接分析[39]和[40]。由于为每个受试者生成脑提取 Mask 的过程耗时,颅骨剥离通常是基于种子的功能连接(FC)分析预处理中的 Bottleneck 。功能连接分析识别大脑中感兴趣区域(ROIs)如何聚集在一起,揭示一组受试者之间的连接模式。为了评估SST-DUNet算法能否可靠地替代FC分析中的手动颅骨剥离,作者比较了手动方法和SSTDUNet方法的连接结果。该分析在数据集1的五个研究组中进行,每组包含八只大鼠受试者,最终得到

的t统计值矩阵,代表区域间连接。这些t统计值首先通过计算8个受试者之间的Fisher Z转换相关系数获得,然后通过单侧t检验得到最终的t统计值。

图7A中手动与SST-DUNet颅骨剥离方法t统计结果的散点图显示,组1呈现强线性关系,斜率为0.996,截距为-0.013,Pearson相关系数(R)为0.994,表明连接结果几乎完全一致。此外,SST-DUNet的表现优于3D UNet和RS

-Net,如图7A所示。此外,该比较在另外四个组中重复进行,结果一致(见图7B)。这些组的相关系数分别为0.991、0.993、0.986和0.989,提供了强有力的证据,证明SST-DUNet为功能连接分析提供了可靠且高效的替代手动颅骨剥离方法。

picture.image

4.3. 独立成分分析

为了进一步分析所提出的fMRI颅骨剥离方法,作者应用了独立成分分析(ICA)。

4.3.1. 方法

无假设的独立成分分析通过结合数据集1(手动=8,SST-DUNet=8,3D UNet=8,RS

-Net=8)的颅骨剥离方法组,在MATLAB中应用一个广受认可的fMRI工具箱(GIFT,v1.3i,www.nitrc.org/projects/gift/)中的组ICA [41], [42], [43], [44], [45]。最初,进行了一个包含30个成分的ICA分解,以识别全脑静息态网络和单个脑区 [41]。此外,还采用了GIFT工具箱中的标准内置方法来评估提取成分的稳定性和可靠性 [42]。

在计算和统计分析中,作者使用了之前研究中开发的内部MATLAB脚本[42],[43]。具体而言,为了进行功能连接(FC)分析,从所有32名受试者(手动=8,SST-DUNet=8,3D UNet=8,RS

-Net=8)中提取了每个30个组件生成的工具箱时间序列。此外,统计测试包括独立应用双尾配对t检验和单样本t检验,并使用错误发现率(FDR)校正(在MATLAB中使用fdr bh函数),以评估组件之间的连接性。

对每个30个组件,计算了所有32名受试者之间的相关系数(CC)。随后,分别针对不同的预处理组计算了平均CC和标准差(Std)。接着,使用单样本t检验(p < 0.05)进行了组内显著性检验。此外,还进行了配对双尾t检验(p=0.05),用于比较手动方法和三种自动颅骨剥离方法。此外,所有p值均使用假发现率(FDR)方法[42], [43]进行了多重比较校正。

此外,为了可视化组级结果,使用MATLAB内置函数生成了散点图、箱线图、蜜蜂图和直方图。重要的是,这些可视化技术提供了对潜在相关性、数据分布和组差异的清晰表示,从而提高了作者研究结果的解释性。

4.3.2. 结果

对来自所有32只大鼠的预处理静息态fMRI(rs-fMRI)数据,在所有手动和三种自动颅骨剥离方法上进行了空间独立成分分析(ICA)。

使用MATLAB中的GIFT工具箱[41],[42],[43],[44],[45],作者首先从每个数据集中提取了30个独立成分(图8A)及其时间序列。随后,利用GIFT工具箱的标准内置验证方法[42],[43]评估了这些成分的质量、稳定性和可靠性。这种无假设的独立成分分析(ICA)方法使得能够对两种手动和自动颅骨剥离方法之间的潜在差异进行全面的大脑研究。

picture.image

为评估组内连接模式,作者对每只大鼠的30个成分分别计算了对称相关系数(CC)。随后,对每个组,作者推导出平均CC(图8B)、标准差(Std)(图8C)以及单样本t检验结果(

,FDR校正,

)(图8D)。有趣的是,这些分析揭示了手动和自动颅骨剥离方法在功能连接模式上具有高度相似性。

为进一步评估组间差异,作者在图9中展示了大鼠手动和其他三种个体自动化颅骨剥离组的30分量组间独立成分分析后分析结果。该图呈现如下:(A) 带回归线的散点图:左侧、中间和右侧面板分别使用红色拟合回归线的散点图独立展示了手动与其他三种个体自动化颅骨剥离方法之间的比较。这些图表示了435个相关系数(CC)值在不同颅骨剥离方法中的分布;(B) 统计显著性检验:左侧、中间和右侧面板展示了成对双尾t检验(

FDR校正,每组

)的结果,评估了手动与其他三种个体自动化颅骨剥离方法在所有435个CC值上的统计差异;(C) 箱线图表示:箱线图展示了手动和三种个体自动化颅骨剥离方法在所有435个样本中平均CC值的分布。它突出了数据的变异性、中心趋势和分布范围;(D) 蜂群图表示:蜂群图提供了手动和三种自动化颅骨剥离方法CC分布的详细可视化,捕捉了单个数据点,同时展示了所有435个CC值上的变异性;(E) 直方图表示:直方图描绘了手动和三种自动化颅骨剥离方法在10个箱中的CC值频率分布,提供了它们统计分布的比较视图。

作者使用散点图(含回归线,图9A)、箱线图(图9C)、蜜蜂巢图(图9D)和直方图(图9E)对数据进行了可视化。有趣的是,箱线图显示Manual方法和SST-DUNet方法在均值、四分位数和异常值上高度相似。此外,作者进行了配对双样本t检验(

,双尾检验,FDR校正,

)以比较Manual方法和3种自动颅骨剥离方法(图9B)。值得注意的是,Manual方法和所提出的SST-DUNet方法之间未观察到统计学上的显著差异,这突显了它们在连接性特征上的惊人相似性。因此,这些结果表明所yinqing-SST-DUNet_2504可靠地再现了手动处理的结果,强调了其用于自动rs-fMRI分析的鲁棒性和潜力。

4.4. 计算成本

为了评估模型在计算成本方面的性能,作者将其与不同方法进行了比较。所有实验均使用RTX 4090 GPU进行;结果如表4所示。如表所示,平均推理时间从RS

-Net的0.62秒减少到yinqing-SST-DUNet_2504的0.55秒。这一优势对于在GPU性能有限的设备上运行模型非常重要,使该方法更适合各种应用。它还证实了yinqing-SST-DUNet_2504在基于深度学习的临床颅骨剥离中的强大性能。

picture.image

4.5. 讨论

据作者所知,本研究首次尝试使用基于Smart Swin Transformer框架的算法进行大鼠脑fMRI颅骨剥离。该算法达到了当前最佳性能,Dice系数达到0.98,与手动分割的大脑相当。鉴于其在颅骨剥离任务中的卓越准确性和计算需求降低,yinqing-SST-DUNet_2504在替代大鼠功能性磁共振成像预处理流程中的手动标注方面显示出巨大潜力。作者将基于深度学习的方法与传统的RATS方法进行了比较,发现前者始终优于后者。在基于深度学习的方法中,yinqing-SST-DUNet_2504实现了最佳性能,利用了Smart Swin Transformer(SST)的优势和密集的互连。这种组合增强了特征提取和信息流,从而在各种数据集上获得更准确和一致的颅骨剥离结果。

基于种子点的功能连接分析结果表明,SST-DUNet是用于大鼠脑fMRI预处理中替代手动颅骨剥离的可靠且高效方法。手动处理结果与SST-DUNet结果之间存在强烈的线性相关性,所有组别中的Pearson系数均持续高于0.98,这证实了所yinqing-SST-DUNet_2504能够保留关键的连接模式。

独立成分分析(ICA)为全脑分析提供了一种强大、无偏且无假设的方法,能够识别功能独立的脑区/网络,并促进对脑功能与连接的深入理解[41][42][43][44][45]。更重要的是,通过将复杂的神经影像数据分解为空间上不同的成分,ICA为内在脑组织提供了宝贵的见解,使其成为功能连接及其他研究中广泛使用的技术。在本文中,作者利用ICA的优势,探索作者新提出的AI自动脑膜剥离方法在脑fMRI预处理流程中的有效性。尽管回归线散点图(图9A)、箱线图(图9C)和双尾配对t检验(图9B)表明,与3D UNet和RS²-Net方法相比,手动方法和SST-DUNet方法之间存在高度相似性,但在使用单样本t检验(p<0.05,FDR校正,n=8)(图8D)、蜜蜂群图(图9D)和直方图(图9E)分析平均CC时,会显现出细微差异。值得注意的是,这些替代可视化方法揭示了平均CC分布中的微小差异,表明每种方法在处理脑膜剥离时存在细微变化。此外,蜜蜂群图突出了单个数据点的离散性,而直方图则展示了不同bin内的频率分布差异。因此,这些发现强调了在评估预处理方法时,尤其是在涉及ICA衍生功能连接分析的研究中,补充统计和可视化技术的重要性。

尽管所提出的SST-DUNet框架在fMRI颅骨剥离方面展现出有前景的结果,但仍需考虑其局限性。该模型是在大鼠脑数据集上进行训练和评估的,这可能影响其在应用于其他物种或脑型时的性能。此外,所开发的SST-DUNet模型在功能图像上的分割精度相较于解剖图像仍然较低,这主要归因于功能图像质量的较低。通过整合解剖图像与功能图像之间的跨模态信息,有可能提升功能图像颅骨剥离的精度。

  1. 结论与未来工作

在本文中,作者提出了一种用于自动预临床fMRI颅骨剥离的新方法,集成了智能Swin Transformer、3D Dense UNet和组合损失。实验结果表明,与基于学习和传统方法相比,yinqing-SST-DUNet_2504具有优越性。在多个数据集上的评估突出了其在预临床大鼠fMRI分析中的可靠性、鲁棒性和泛化能力。

尽管作者提出的脑组织剥离方法展现出较强的泛化能力,但其性能可能受成像协议、扫描仪类型及数据集特征差异的影响。在高度多样化的数据集上获得最佳结果可能需要微调或重新训练。此外,作者所有实验均在大鼠fMRI数据上开展,为验证该方法在不同临床前模型中的适应性,仍需在老鼠数据集上进行进一步验证。未来工作将集中于扩展数据集多样性,并在不同成像条件下评估该方法,以增强其鲁棒性和适用性。

点击上方卡片,关注「AI视界引擎」公众号

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论