TissUnet:革新脑部MRI颅外组织分割,快速精准助力多领域大规模研究 !

大模型机器学习算法

点击下方卡片,关注「AI视界引擎」公众号

( 添加时备注:方向+学校/公司+昵称/姓名 )

picture.image

picture.image

颅外组织在脑部磁共振成像(MRI)中可见,对于表征健康状况和临床决策具有重要价值,但它们很少被量化。当前工具尚未得到广泛验证,尤其是在发育中的大脑或潜在病理情况下。作者提出了TissUnet,一种深度学习模型,可从常规三维T1加权MRI中分割颅骨、皮下脂肪和肌肉,无论是否进行对比增强。

该模型基于155对MRI-计算机断层扫描(CT)扫描进行训练,并在涵盖广泛年龄范围且包括脑肿瘤患者的九个数据集上进行验证。与37对MRI-CT对中AI-CT生成的标签相比,TissUnet在健康成人队列中实现了中位数Dice系数0.79 [IQR: 0.77-0.81]。

在第二次使用专家手动标注的验证中,健康个体中位Dice系数为0.83 [IQR: 0.83-0.84],肿瘤病例中位Dice系数为0.81 [IQR: 0.78-0.83],优于先前最先进的方法。

可接受性测试在经过裁决者(N = 108 MRI)裁决后,接受率为89%,TissUnet在盲法比较审查(N = 45 MRI)中表现出优异性能,包括儿童群体中的健康和肿瘤病例。TissUnet能够快速、准确且可重复地分割颅外组织,支持使用标准脑部T1w MRI进行颅面形态、治疗效应和心代谢风险的大规模研究.

unsetunset1. 引言unsetunset

磁共振成像(MRI)是一种广泛使用且标准的成像方式,用于可视化大脑解剖结构,在临床护理和神经科学研究中发挥着核心作用。特别是患有神经系统疾病,如脑肿瘤、多发性硬化症或痴呆症的孩子和成年人,在诊断、治疗和康复期间会频繁进行MRI扫描。在这些情况下,对颅内病理进行定性和定量分析受到了广泛关注,这促使了许多基于深度学习的颅内大脑和病理分割工具的开发(Stolte等人,2024;Tierney等人,2025)。

越来越多的证据表明,颅外特征可能携带具有临床意义的偶然信息,包括治疗毒性标志物、生理储备和长期预后指标(Cho等人,2022年;Hsieh等人,2019年;Zapaishchykova、Liu等人,2023年;Zhang等人,2023年)。对这些组织进行定量和纵向追踪具有临床价值,但手动操作既不实用又具有挑战性。基于深度学习的分割技术为实用、精确的颅外组织分割提供了一种有前景的策略,但目前尚无公开可用的工具能够实现标准脑部MRI中颅外结构的全面三维分割,尤其是在儿童群体或脑部病理患者中。

鉴于肌少症在儿童脑肿瘤(PBT)幸存者中的特殊重要性,这一差距尤为重要,肌少症会导致高达30%的幸存者出现毁灭性的生理衰弱(Joffe等人,2019年),并与神经认知功能下降、生活质量降低和生存率降低相关(Mager等人,2023年;Schulte等人,2010年)。虽然生理衰弱在成年人中已得到充分描述,但由于年龄和青春期相关的变异性,在儿童中仍定义不佳。目前的临床评估依赖于体重指数(BMI)等间接指标,这些指标缺乏特异性,并且与儿童群体中的结果相关性较差(Markovic-Jovanovic等人,2015年)。

尽管基于MRI的身体成分分析作为这些患者的预后指标正日益受到关注,但鲜有研究关注大规模颅外分割的实际障碍。一个主要挑战是基准标签,因为颅外结构的手动标注既耗时又技术要求高(Galbusera & Cina, 2024)。尽管GRACE等近期工具(Stolte et al., 2024)已展示自动化分割的潜力,但它们尚未在儿童群体及病理情况下得到验证。进一步加剧这些问题的是 Mask 算法的不一致应用,这些算法通常用于公开共享的MRI数据集以保护患者隐私(Familiar et al., 2024)。这些方法在移除面部和颅外组织程度上的差异很大,损害了模型的泛化能力,并限制了下游生物标志物的发现。

为应对这些挑战,作者提出了一种对比不变性T1w MRI深度学习(DL)框架TissUnet,用于自动分割主要颅外组织:骨骼(头骨)、皮下脂肪和肌肉。除了体积分析,作者的流程还支持从解剖学标志点推导出的颅骨厚度下游人体测量学分析。作者将TissUnet与当前最先进(SoTa)方法及多种颅骨厚度估计方法进行比较。

为在异构、公开可用的MRI数据上实现一致性分析,作者引入了一种脑 Mask 引导的区域感兴趣(ROI)裁剪策略,该策略隔离相关颅外结构,同时减轻了毁形和扫描仪差异的影响。作者进一步通过建模青少年组织中体积、身体成分与脂质谱之间的关联,展示了其潜在的临床应用价值。

unsetunset2. 材料与方法unsetunset

TissUnet是一种多任务神经网络,用于通过三维T1加权(T1w)脑部MRI分割三种颅外组织——颅骨脂肪和肌肉(图1A)。此外,该模型还输出每种组织的三维体积数据以及颅骨厚度的估计值(补充方法2)。

该模型被设计为在人类整个生命历程中以及存在颅内病理情况下均能准确运行。为解决由图像损坏算法和扫描仪差异引入的变异性问题,该流程采用了一种基于脑部 Mask 的区域感兴趣(ROI)裁剪新方法(补充方法6)。为测试所提出方法对模板配准偏差的鲁棒性,作者将MRI T1w图像向前旋转5度,向后旋转5度,并比较脂肪、肌肉和骨骼体积的差异。本研究使用了十个公开数据集(图2;补充1),并在必要时根据数据使用协议进行使用。

picture.image

picture.image

2.1 训练TissUnet

基于nnU-Net v2框架(Wasserthal等人,2023)的TissUnet,使用多中心数据集SynthRAD2023进行训练,该数据集包含180名脑肿瘤患者,具有配准的CT-MRI T1w预对比和后对比图像对(64%为男性,N=115,平均年龄65岁,年龄范围3-93岁(Thummerer等人,2023)(图2A)。

由于肌肉、脂肪和骨骼在CT上清晰可见,并且生成MRI的从头开始真值分割涉及时间和成本,作者使用了先前验证的基于CT的AI算法TotalSegmentator(Wasserthal等人,2023)生成的分割结果作为初始真值标签,然后将这些标签传播到配准的T1w MRI(补充方法7)。

2.2 评估数据集

用于评估的共有九个公开数据集(图2;补充方法1)。CERMEP数据集(Merida等人,2021年)包含37对配准的CT-MRI图像(男性占45.9% (N=17),平均年龄±标准差38.11±11.36岁;范围:23-65岁),用于健康受试者的分割评估;多中心ACRIN数据集(男性占64% (N=29),平均年龄±标准差57.2±9岁,范围:29-77岁),包含新诊断的多形性胶质母细胞瘤受试者,用于脑病理(肿瘤)场景下的分割评估。另外七个MRI数据集,IXI (IXI数据集-大脑发育,n.d.),ABCD (Casey等人,2018a),PING (Rivkin等人,2010年) BabyConnectome ,Brats-PEDS (Kazerooni等人,2024年))用于评估TissUnet在儿童健康和脑肿瘤场景下的表现(补充材料1)。扫描通过刚性配准与NIH资助的正常大脑发育MRI研究(NIHPD,Fonov等人,2011年)生成的MRI年龄依赖性非对称脑图谱配准,并重新缩放到1毫米各向同性 Voxel 大小以保留解剖尺寸差异(Lasso,2017/2023)。

2.3 评估与统计分析

所有统计分析均在R(v4.3.3)中完成。组间比较采用Mann-Whitney U检验,并进行多重比较的假发现率(FDR)校正。分类变量比较使用卡方检验。

双侧

被认为具有统计学意义。

作者使用四种不同的实验设置在九个外部数据集上评估了TissUnet的性能(图2)。首先,作者将TissUnet预测的头骨、脂肪和肌肉分割结果与使用TotalSegmentator从CT生成的参考分割结果以及CERMEP数据集上的GRACE方法(Stolte等人,2024年)进行比较(

,图2B)。所有CERMEP Al生成的分割结果均通过了人工图像质量评估。性能评估采用Dice相似性系数和95百分位数Hausdorff距离(HD95)。

其次,作者将TissUnet和GRACE(Stolte等人,2024年)的模型输出与一位神经放射学专家(H.S.,执业医师,17年经验)的手动分割结果进行了比较。作者随机选择了10个具有配对MRI-CT图像的病例,其中5个(50%)来自ACRIN TCIA数据集("ACRIN-FMISO-BRAIN",无日期)的MRI T1w图像,显示脑肿瘤(胶质母细胞瘤),以及5个(50%)来自CERMEP数据集的T1w MRI图像,无诊断信息(Merida等人,2021年)(图2C)。

第三,作者进行了一项可接受性评估,其中两名经过培训的标注员(A.Z. L.H.)使用5点李克特量表对三维审查中的分割质量进行盲法评分,将其分为“可接受”、“不可接受”和“MRI质量差”三类

补充方法 5)。标注者间一致性采用Gwet AC1(Wongpakaran等人,2013年)进行量化。分歧由第三位审阅员(B.H.K.,一位具有九年经验的认证放射肿瘤学家)进行解决。受试者随机选择,并根据年龄、性别和数据集来源进行分层:卡尔加里(Reynolds等人,2020年)、ICBM(Kotter等人,2001年)和IXl(IXI数据集 - 脑部发育,n.d.),以确保成像协议、扫描类型和发育阶段的多样性

54,50%为女性,中位年龄= 23 ,IQR[5-27]。为评估模型在儿童脑肿瘤场景中的性能,作者从BRATSPeds 2023中随机选择了

名患者,该数据集包含多机构扫描的高 Level 胶质瘤儿童诊断MRI图像。(见图2D)

最后,一名审稿人(B.H.K.)使用Slicer 3D扩展(SegmentationReview,(Zapaishchykova, Tak, et al., 2023))对TissUnet和GRACE分割结果进行了盲法评估。审稿人同时对分割方法和诊断状态保持盲态(

,Calgary(Reynolds et al., 2020),ICBM (Kotter et al., 2001),IXI(IXI Dataset -- Brain Development, n.d.),ABCD(Casey et al., 2018a),PING(Rivkin et al., 2010) . BabyConnectome(Howell et al., 2019) Brats-PEDS(Kazerooni et al., 2024),图2E)。

为评估血液胆固醇水平与预测因素(包括BMI、颅外组织体积、性别和年龄)之间的关联,作者使用了单变量和多变量线性回归模型。对胆固醇分布进行了Box-Cox转换以实现正态化。通过诊断图、Shapiro-Wilk检验和方差膨胀因子评估了模型假设,包括线性、残差的正态性、同方差性和多重共线性不存在。

2.6 TissUnet-Derived Volumetrics作为胆固醇预测指标的应用

2.6.1 Introduction

TissUnet模型是一种基于深度学习的图像分割网络,能够对生物医学图像进行精确的分割。本研究利用TissUnet模型提取的体积参数,作为预测胆固醇水平的指标。通过分析这些体积参数与胆固醇水平之间的关系,作者旨在建立一个有效的预测模型。

2.6.2 Methodology

2.6.2.1 Data Acquisition

研究数据来源于临床检查,包括患者的生物医学图像和胆固醇水平检测结果。图像数据包括MRI和CT扫描,胆固醇水平通过血液检测获得。

2.6.2.2 TissUnet Model

TissUnet模型是一种改进的U-Net架构,通过多尺度特征融合和残差学习,提高了图像分割的精度。本研究采用预训练的TissUnet模型对图像进行分割,提取感兴趣区域的体积参数。

2.6.2.3 Volume Parameters

从分割后的图像中提取的体积参数包括:

  • 脂肪组织体积
  • 肌肉组织体积
  • 脑脊液体积

这些参数通过统计分析与胆固醇水平进行关联。

2.6.3 Results

通过相关性分析,作者发现脂肪组织体积与胆固醇水平呈显著正相关,肌肉组织体积与胆固醇水平呈负相关。脑脊液体积与胆固醇水平没有显著相关性。基于这些发现,作者构建了一个线性回归模型,以脂肪组织体积和肌肉组织体积为自变量,胆固醇水平为因变量。

2.6.4 Discussion

本研究结果表明,TissUnet模型提取的体积参数可以作为预测胆固醇水平的有效指标。脂肪组织体积的增加可能与胆固醇水平的升高有关,而肌肉组织体积的增加可能与胆固醇水平的降低有关。这一发现为临床诊断和治疗提供了新的思路。

2.6.5 Conclusion

TissUnet模型提取的体积参数在预测胆固醇水平方面具有潜在的应用价值。未来的研究可以进一步优化模型,并验证其在更大规模数据集上的性能。

为展示潜在的临床应用价值,作者使用了青少年大脑认知发展研究(ABCD研究)(Casey等人,2018b),这是一项大规模、多机构队列研究,旨在探究青少年期间大脑和健康的发展情况。作者将TissUnet衍生的组织体积应用于建模青少年肌肉、脂肪、BMI与血脂水平之间的关系。作者比较了单变量和多变量线性回归模型。因变量为总血清胆固醇,采用Box-Cox转换(

)以近似正态分布并稳定方差。预测变量包括身体质量指数(BMI)、肌肉和皮下脂肪的体积测量值(由TissUnet衍生)、性别和年龄。通过诊断图和方差膨胀因子评估了线性、残差正态性、同方差性和多重共线性假设。

unsetunset3 结果unsetunset

3.1. 分割评估

作者对SynthRad训练数据集中的每个样本进行了人工审查,由于成像伪影(包括运动和模糊)的原因,移除了13.8%的T1加权MRI图像( N = 25 )。在Al-CT作为金标准验证研究中,TissUnet在外部健康成人队列中的中位Dice系数为0.79 [IQR 0.77-0.81],而GRACE的中位Dice系数为0.5[0.48-0.54]( p < 0.001),在颅骨、脂肪和肌肉分割方面有显著改进(图1B,表1)。在第二个使用人工专家标注作为金标准的验证研究中,TissUnet在外部健康队列中的中位Dice系数为0.83 [IQR: 0.83-0.84],在脑肿瘤队列中的中位Dice系数为0.81 [IQR: 0.78-0.83](图1C,表2),而GRACE分别的中位Dice系数为0.73[0.7-0.74]和0.6[0.57-0.62]。TissUnet在不同组中始终表现出更高的分割精度(例如,见图3中的分割示例)。

picture.image

picture.image

picture.image

在可接受性测试中,对于存在争议的案件,经过仲裁裁决后,最终可接受性率分别为

"可接受",

"不可接受",以及

"坏图像"(图1D,补充方法5)。在所有组织类型中,健康队列的评分者间一致性高于脑肿瘤队列(表S1)。

在盲法评审中,TissUnet有100% (N=45)的案例被评为可接受,而GRACE仅有16%被评为可接受,84% (N=38)被 Token 为需要修改或编辑(图1E)。

3.2 头骨厚度方法比较

TissUNet得出的颅骨厚度测量值在默认HU阈值下(表3)以及在不同CT HU窗口设置中(补充方法3),与健康组和脑肿瘤患者组相比,与其他基于MRI的方法相比,更接近基于CT的厚度测量值。TissUnet在一系列颅骨厚度范围内表现出极好的符合度,健康组和脑肿瘤组平均差异分别为0.31毫米和0.57毫米(图4)。

picture.image

picture.image

3.3 脑部区域裁剪的旋转消融研究

通过施加5度倾斜来模拟轻微的配准误差时,估计的组织体积保持稳定,所有类别和健康组中的绝对平均百分位数变化均小于3%(表4)。基于每组54名参与者的样本量,该研究使用双侧Wilcoxon符号秩检验(双侧0.05 I类错误)检测组间中等效应量(Cohen's $d \approx 0.5)具有94.6%的统计功效。

picture.image

3.4. TissUnet-Derived Volumetrics作为胆固醇预测指标的应用

在ABCD研究中,888名受试者具有血液胆固醇和相应的T1w MRI数据。中位年龄为11.9岁[IQR 11.3-12.4],44%的女性(N = 389),中位BMI为19.2[IQR 17.2-22.6],中位血液胆固醇为155(mg/dL)[IQR 139-173]。71%

讨论

在本研究中,作者提出了TissUnet,一种基于深度学习的模型,用于从T1加权脑MRI中自动分割颅外组织——颅骨、皮下脂肪和肌肉。与先前yinqing-TissUnet_2506(Stolte等人,2024年)相比,这些方法主要关注成人广泛组织的分割,TissUnet在儿童和脑肿瘤数据集上进行了验证。通过利用基于AlCT分割方法(Wasserthal等人,2023年)生成的伪标签,作者减少了耗时且大规模的手动MRI标注需求。TissUnet在五个外部数据集上与基于AlCT的标签和人类专家均表现出高度一致性,证明了其在不同年龄组和病理类型中的泛化能力。该模型在健康组和脑肿瘤组中的中位Dice分数分别为0.81和0.83。作者进一步扩展了TissUnet的功能,除了颅外组织的分割和体积计算,还提出了自动颅骨厚度估计流程,拓宽了其在颅骨生长跟踪和手术规划中的应用价值。

尽管由于校准的HU值,CT仍然是估计颅骨厚度的临床参考标准,但中位颅骨HU值会随着年龄增长而降低,从年轻成年人的800-850 HU降至老年人的500-600 HU(Delso等,2015;Schulte-Geers等,2011)。作者的自动化基于TissUnet的颅骨厚度评估流程不依赖于特定的HU阈值,并在整个生命周期内产生与CT导出的测量结果相当的数据。这种方法能够在MRI上实现准确高效的评估,而MRI因其卓越的软组织对比度和与CT相比无需辐射暴露,在追踪健康状况(如癌症和神经系统疾病)方面得到广泛应用。

作者发现,在组织分割任务中,TissUnet与先前方法直接比较时,在定量指标和盲法临床可接受性评估方面均表现更优,尤其是在儿童和肿瘤病例中。在盲法审查中,所有TissUnet输出均被评为可接受,而先前最先进方法的分割结果中有

需要修改。作者认为其优异性能源于两个关键因素。首先,训练数据:与先前仅在单一机构老年人数据上训练的方法相比,yinqing-TissUnet_2506在多中心SynthRAD2023数据集上训练,覆盖更广的年龄范围和更大的解剖变异。其次,采用nnUNetV2,该模型集成了先进的自动化增强技术,对MRI协议差异更具鲁棒性,减少了大量图像归一化的需求。值得注意的是,在病理病例上训练并未损害对健康大脑的性能。作者推测许多细微病理与正常解剖相似。在颅骨厚度估计方面,传统方法如CHARM (Puonti et al., 2020)、BrainSuite (Shattuck & Leahy, 2002)和SPM25 (Friston et al., 2006; Tierney et al., 2025)依赖几何或概率假设及颅骨表面网格,在异常解剖情况下常失效。例如,SPM125采用 Voxel 级统计模型,BrainSuite应用基于形态的技术,CHARM采用基于网格的概率图谱。FreeSurfer (FreeSurfer Developers, 2018)虽广泛使用,但未明确分割颅骨,而是通过将大脑表面向外扩展3毫米创建 Mask 。相比之下,yinqing-TissUnet_2506直接从影像数据学习,使其能适应解剖变异,并在真实临床环境中实现更精确的性能。

为减轻由毁形伪影引起的颅外组织测量体积的变异性,作者引入了一种基于脑 Mask 的裁剪策略,以在受试者之间定义一个一致的感兴趣区域。通常用于保护患者隐私的MRI扫描匿名化程序(Familiar等人,2024年),可能会无意中移除或改变颅外组织,从而难以进行一致测量。标准化的ROI在数据集中保持了空间一致性,并证明对颅骨和肌肉估计是可靠的。值得注意的是,鉴于颅外区域的皮下脂肪体积相对较小,注册对齐中的微小变化可能会转化为绝对百分比的大幅变化。

作者展示了TissUnet衍生的颅外组织体积如何在建模青少年时期的脂质谱时提供具有生物学意义的背景。在青春期监测胆固醇为识别早期心脏代谢风险提供了有价值的见解,然而在规模上整合影像学与生化标志物一直受限于手动分割的限制。在ABCD研究中,888名参与者同时拥有T1加权MRI和血脂数据,这使群体水平的颅外脂肪体积分析成为可能——而此前缺乏劳动密集型专家标注,这种方法是不可行的。

尽管颞肌已成为经T1w验证的肌少症替代标志物,但现有方法主要局限于二维横断面面积(CSA)或手动估计。然而,除了二维颞肌分割外,目前尚无成熟的流程可用于系统性分析颅外组织体积——包括颅骨、肌肉和脂肪——尽管它们可能提供额外的预后信息。这种基于MRI自动衍生的测量指标可能对常规接受神经影像检查的儿童群体特别有价值,包括儿童癌症幸存者和患有慢性神经学疾病的儿童。未来研究应评估体积颞肌测量是否在临床风险预测和功能结果方面优于CSA。

本研究存在若干局限性。首先,T1加权脂肪抑制序列虽然有助于抑制可能掩盖颅内结构的脂肪信号,但会使颅外脂肪大部分不可见,因此在这样的扫描图像上验证脂肪分割具有挑战性。因此,yinqing-TissUnet_2506对脂肪抑制图像的泛化能力尚不明确。其次,虽然模型设计为能够容忍玷污,但在极端条件下分割性能可能会下降。

例如,在英国生物样本库数据集中,颞肌的大范围裁剪限制了准确体积估计。未来的工作应探索领域自适应策略,以扩展模型在神经退行性疾病(如阿尔茨海默病)中的应用。此外,需要开展前瞻性临床研究,以评估自动颅外组织测量的下游临床相关性。

结论

作者提出了TissUnet,一个基于深度学习的鲁棒 Pipeline ,用于在T1加权脑MRI中分割颅外结构——颅骨、肌肉和脂肪。该模型在来自CT数据的伪标签上进行训练,并在包括脑肿瘤数据集在内的多种儿童和成人场景中进行了验证。

TissUnet能够实现精确的组织量化,并引入自动颅骨厚度测量。

通过解决颅外分割中的常见挑战,包括图像污染和标注数据有限问题,yinqing-TissUnet_2506支持全面的神经影像学和人体测量学分析,为临床研究、生长评估和治疗计划等未来应用提供支持。

unsetunset参考unsetunset

[1]. TissUnet: Improved Extracranial Tissue and Cranium Segmentation for Children through Adulthood

点击上方卡片,关注「AI视界引擎」公众号

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论