自动精细化多提示策略,MedSAM-U 利用不确定性引导实现高效图像分割 !

图像处理机器学习关系型数据库

点击下方卡片,关注 「AI视界引擎」 公众号

( 添加时备注:方向+学校/公司+昵称/姓名 )

picture.image

picture.image

医疗图像分割中的任何模型(MedSAM)在医学图像分割方面表现出令人瞩目的性能,引起了领域的广泛关注。然而,它对不同提示类型和位置的敏感性带来了挑战。本文通过专注于开发增强MedSAM准确性的可靠提示来解决这些挑战。

作者提出了一种名为MedSAM-U的不确定性指导框架,旨在自动优化多提示输入,从而获得更加可靠和精确的医学图像分割。

具体而言,作者首先训练一个与MedSAM集成的多提示 Adapter ,创建MPA-MedSAM,以适配多种多提示输入。

然后,作者采用不确定性指导的多提示,有效地估算了与提示及其初始分割结果相关的不确定性。尤其在MedSAM-U中,作者还应用了一种新的不确定性引导提示适配技术,以自动推导出可靠提示及其对应的分割结果。

作者将MedSAM-U通过来自多个模态的数据集进行验证,以训练一个通用的图像分割模型。

与MedSAM相比,实验结果在五个不同的模态数据集上表明,所提出的MedSAM-U在不确定性引导的提示上实现了平均性能提高1.7%到20.5%。

I Introduction

医学图像分割是医学图像分析中的一个重要任务,对于许多临床应用具有关键意义。准确的分割有助于明确定义解剖结构及病变区域,这对于疾病的诊断、治疗规划和监测至关重要。广泛应用于皮肤镜像、CT、MRI、结肠镜检查和超声。传统的U-Net基础分割方法已经证明具有很高的分割性能。然而,这些模型大多针对特定任务设计,且往往难以在其他领域实现迁移性。因此,随着Segment Anything模型(SAM)[6]和MedSAM[7]等基础模型的兴起,并表现出其在各种数据集上的通用适用性和精确分割能力,使这一问题得到解决。至关重要的是,这些模型是在所有数据集上进行训练的,并使用不同的提示来实现更准确的分割结果。如同[8]中所述,高质量的提示能带来良好的表现。因此,本研究关注于如何在测试时自动获取有效的提示,而不需要重新训练模型。

如图1(a)所示,作者使用各种箱形提示(包括不同的长宽比和图像内位置的提示)来演示SAM和MedSAM在五个数据集上的分割性能。这些不同箱形提示的变化是为了揭示箱形位置对最终分割结果产生的显著影响。此外,如[8]中所述,指示点提示对分割性能的影响也得到了证明。因此,本研究的另一关键重点是训练MedSAM以适应不同的提示。最后,如图1(b)所示,MedSAM的单一步骤产生单一分割结果的方式缺乏可靠性。本研究旨在利用可靠性自动获取有效的提示,从而实现更准确的分割结果。

picture.image

不确定性是评估模型置信度或可靠性的关键指标。现有的不确定性估计方法包括基于随机放弃的方法[9],集成方法[10],基于熵的方法[11],基于信念的方法[12],以及基于确定性论点的方法[13]。考虑到MedSAM中涉及的广泛参数,从头构建具有不确定性估计的全新模型需要巨大的计算资源和时间。此外,本研究的关键方面是探索如何利用估算的像素级不确定性获得不同类型的可靠提示。

为了解决这些挑战,作者提出了一种自动不确定性引导的自动多提示框架MedSAM-U,如图1(b)所示。MedSAM-U整合了箱形和指示点提示来增强分割精度。然后,它使用不确定性引导的多提示(UGMP)来有效估算提示及其初始分割结果相关的不确定性。作者的方法还引入了一种新的不确定性引导提示适应(UGPA)技术,使自适应多提示以提高分割可靠性和准确性。本工作的贡献如下所述。

作者提出了MedSAM-U,该方法利用不确定性和指导自动预测可靠的分割结果。据作者所知,这是首次尝试利用多提示的不确定性引导适应来实现可靠的MedSAM。

作者在不需要额外训练参数的情况下,使用不确定性引导多提示(UGMP)来估计MedSAM中不同提示的不确定性。

作者引入了不确定性引导提示适应(UGPA)技术,使用估计的测试时不确定性自动获取可靠的提示,从而实现准确的分割预测。

在五个不同的模式(皮肤检查、结肠镜检查、超声、CT和MRI)数据集上进行了统一的训练和测试,证明了MedSAM-U的可靠性及准确性。

II 相关工作

SAM for medical image segmentation

传统深度学习方法[2, 14, 15]主要用于特定任务,并在将其他领域进行迁移时面临挑战。SAM[6]是用于分割领域的开创性大型基础模型,由图像编码器、提示编码器和 Mask 解码器三个主要组成部分构成。图像编码器基于已使用 Mask 自编码器(MAE)预训练的标准视觉 Transformer (ViT)。提示编码器可以以稀疏(例如盒)或密集(例如 Mask )的方式工作。 Mask 解码器是一个适应 Including 动态 Mask 预测头的Transformer解码块。这个解码器使用双向交叉注意力机制捕捉提示和图像嵌入之间的交互。随后,SAM将图像嵌入上採样,然后SAM再将图像嵌入上採样,并使用多层感知机(MLP)将产生的标记映射到预测给定图像的 GT 值(GT)的动态线性分类器。由于其强大的零样本性能,SAM在图像分割领域取得了重大突破。

为了提高SAM在医学图像分割任务上的不尽如人意表现,一些方法是将SAM在医学图像上进行微调,包括完全微调和参数高效微调[16, 17, 18, 19]。最近,MedSAM[7]已经研究了SAM在医学图像分割的应用,探索了其在各种环境下的性能,如内窥镜手术[20],肿瘤分割[21],扁平异物[22]。然而,现有的MedSAM方法很少研究不同提示对敏感性的影响。

Prompts-based methods for medical image segmentation

基于提示的方法在医学图像分割任务中得到了广泛的关注,主要是因为它们在交互式分割任务过程中能够提供灵活和适应性的指导。虽然在一些情况下,目前的SAM(形状表示学习)的变体极大地依赖于高质量、标准提示(如点、矩形和 Mask )来在医学图像分割任务上获得令人满意的性能。吴等人《[23]介绍了一种用于将2D SAM适应到3D医学图像的空间-深度转置方法,以及超提示扩展 Adapter 以进行提示条件适应的Hyper-Prompting Adapter,Deng等人《[24]提出了一种使用蒙特卡罗方法和测试时增强的多提示触发不确定性估计的SAM(形状表示学习)来提高性能并提供分割后病变或组织的像素级可靠性,李等人《[25]提出了一种使用SAM的预训练视觉 Transformer 和轻量级 Adapter 的3D医学图像分割模型,具有混合网络和边界感知损失,以获得精确结果,Wu等人《[26]介绍了一种结合单击和交互方法的处理未见任务的方法,一次遍历单提示。目前,大多数基于MedSAM的方法都限于使用一种提示类型,而不是多种提示类型[24, 25, 27, 28]。这会减少模型的可利用信息,可能导致分割性能不足。

Uncertainty-based methods for medical image segmentation

不确定性估计在分割领域越来越重要,因为它提供了一种评估模型预测信心的方法。这在高风险应用中如医学影像分析中尤为重要,错误可能导致严重后果。不确定性的两个主要类型是随机性,源于数据固有噪声[30],和认知性,源于模型的局限性——这是增强深度神经网络可靠性的关键所在[31]。例如,Saad等人[32]利用形状和外观先验知识定量表示概率医学影像分割的不确定性。Parisot等人[33]利用分割不确定性来告知适应性采样策略以同时分割和配准脑肿瘤。此外,Prassni等人[34]开发了一种方法,用于可视化随机行走分割的不确定性,并将其应用到脑部磁共振和腹部CT图像的体积分割中。Zou等人[35]提出了一个可信的肿瘤分割网络,通过利用主观逻辑理论建模不确定性并将类概率参数化为Dirichlet分布来产生稳健的分割结果和可靠的不确定性估计。

此外,对于大型模型如SAM,不确定性估计对于提高分割结果的可靠性至关重要[24]。Yao等人[27]提出了一种测试阶段提示增强技术,将多框增强与aleatoric不确定性基于的FN和FP校正策略相结合,以提高医学影像分割。Zhang等人[28]提出了UR-SAM,一种以不确定性校正为基础的增强框架,通过结合提示增强与不确定性校正来提高SAM在医学影像分割中的可靠性。然而,尽管有了这些进展,关于结合提示型MedSAM的不确定性估计的研究仍然不足,尤其是在如何利用不确定性来引导可靠的提示方面。

III Method

首先,作者概述了MedSAM-U架构的组成,其主要包括三个主要组件:MPA-MedSAM、UGMP和UGPA模块。作者提出的整体框架如图2所示。作者构建了一个以不确定性为指导的自动框架,用于自适应地微调多提示以实现可靠且精确的像素 Level 的医学图像分割结果。具体而言,该方法包括以下三个方面:1) 利用MPA训练多提示自动适应,将点和框线索集成,以实现更精确的医学图像分割结果。2) 在参考时间内,利用UGMP评估与各种提示相关的不确定性,无需增加额外的训练参数。3) 引入UGPA,自动利用估计的不确定性推导更可靠的通知,从而提高分割结果的性能。

picture.image

Multi-Prompt Adaptation for MedSAM

MedSAM [7]主要依赖边界框提示作为分割任务的初始输入,但在训练过程中并未引入点提示。这意味着MedSAM的分割能力优化为有边界框标注的场景,但可能没有完全利用基于点的输入的潜在效益。 formally,在MedSAM中,输入和预测 Mask 之间的关系可以正式表示为:

其中表示输入图像,表示边界框提示,,和分别表示MedSAM的解码器、图像编码器和提示编码模块,是MedSAM产生的分割 Mask 。

此外,如[8, 19]所述,点提示对分割性能的影响得到证明,特别是正点。因此,为了提高稀疏编码器,本研究提出修改以细化点的编码,并优化每个提示类型的位置编码与学习的嵌入集成。作者提出MPA,旨在处理和适应MedSAM的多种提示输入,包括点与框的组合。

作者的目标是通过微调调整将MedSAM适应多提示,称为MPA-MedSAM,以增强MedSAM的灵活性,无需进行全面再训练。不是调整所有参数,作者将预训练的MedSAM参数冻结,只除了提示编码器,开发一个 Adapter 模块,并将其集成到图像编码器指定位置。结构上, Adapter 作为一个瓶颈模型,包含三个关键组件:一个下投影,ReLU激活和上投影,依次如图2(a)所示,类似于Med-SA[23]。由于MedSAM在将多类型提示合并时没有改进,作者解冻提示编码器以扩展其能力。

为了打破这一限制,作者解冻提示编码器以扩大其能力。这项调整使得MedSAM能够有效处理多种提示,解决早期版本中遇到的限制。对于交互式分割,作者在训练过程中同时使用点提示和边界框(BBox)提示。提示由随机选择点并应用分割 Mask 生成的噪音而得。这模拟了用户不准确的不同 Level ,使模型对现实世界的变化更具鲁棒性,并增强其实用应用程序中的适应性。MPA-MedSAM中输入和预测 Mask 的之间的关系可以正式表示为:

picture.image

其中表示输入图像,表示点提示,表示边界框提示,是MPA-MedSAM产生的分割 Mask 。函数包含MPA-MedSAM,该解码输入图像、点提示和边界框提示以生成相应的 Mask 。

Uncertainty estimation of MPA-MedSAM with multi-type prompts

考虑到用户需求的多样性以及不同经验水平之间的差异,MedSAM的分割性能对Bbox的位置非常敏感,可能引发推理错误。为了解决这个问题,作者采用了一种类似于SAM-U [24]中使用的方法。在本文中,作者引入了UGMP,以提高MPA-MedSAM的准确性。假设给出一个初始Bbox ,通过使用简单的随机增强策略对进行处理,作者生成了N个多个Bbox提示,如下所示:

, 其中 , 表示初始Bbox,这些随机盒是通过将调整应用于生成的, 表示正态分布, 表示 的坐标, 表示对 应用的扰动程度。生成一组多个Bbox提示 ,以及一组M个点的提示 ,这取决于用户或医生的选择,如果未使用任何点,则 。为了量化多种提示使用所带来的不确定性,作者假设 N 个盒提示、M 个点提示和输入图像 ,MPA-MedSAM 预测一组结果 , 其中 的预测如下:

其中 表示集合 的第 个 Box , 表示将 输入到 MedSAM 中得到的分割结果。

通过将这些预测进行聚合,可以得到增强的分割精度并降低不确定性。最终的组合预测可以表示为:

其中 表示将 MPA-MedSAM 模型应用于 个实例的平均分割结果。

通过利用 UGMP,将单个给定图像 的概率不确定性,而不是从每个单独的预测 中得到,现在直接从聚合预测 中估计,描述熵 [36]:

其中 . 这使得作者可以基于聚合预测 估计不确定性分布,而不是为每个单个预测 计算分布。

总之,MPA-MedSAM 与 UGPM 的函数可以表述如下:

本文提出了一种名为多提示分割(Multi-Prompt Segmentation)的方法,用于对输入图像进行分割。其中,代表输入图像,是多个边界框提示 ,是多个点提示 ,这些提示的选择取决于用户或临床医生。是基于多个提示预测的组合产生的分割 Mask ,是相应的关联不确定性图。

Uncertainty-Guided Prompts Adaptation

提供能够产生预期结果的提示是一个困难的过程,常常需要用户或专家进行繁琐的尝试与错误实验。由于在推理过程中不同提示引入的不确定性,作者研究了是否可以利用知识来完善初始提示,从而产生更准确和精确的分割 Mask 输出。为了解决这个问题,作者提出了一种名为UGPA的策略,用于在一系列示例提示上进行优化以提高分割效果。通过UGPA,可以自动进行提示的精细调整。图2(b)展示了作者提出的UGPA的流程图。

在作者的UGPA过程中,首先,作者根据U中的边缘选择前K个Bboxes,这些Bboxes突出了图像中高不确定性的区域。然后对这些框进行微调,模拟专家调整以提高它们的精度。接下来,作者从U中选择具有最高不确定性值的前K个点,这些点代表了图像中最不确定的区域。然后选取的这些点与调整后的Bboxes相结合,以创建优化后的提示。为了清楚地描述流程,作者使用以下公式表示每一步:

其中:

在上述公式中,w_{min}, h_{min}和w_{max}, h_{max}分别表示输入图像中的最小宽度和最小高度。通过这些调整,作者可以提高模型的分割效果。

边(Edge(U))指的是确定不确定性图()的边缘坐标, 指的是边缘点的坐标。具体来说, 表示不确定性图的左上角坐标, 表示包含这些边缘点的不确定性图边界框的右下角坐标。作者根据 的边缘选择Top-1 Bbox,该Bbox 具有最大面积且完全包含这些边缘点。然后,作者还应用公式(4)模拟不同专家知识水平,生成分解框提示 。接下来,作者从 中选择具有最高不确定性值的Top- 个点:

其中, 表示排序函数, 表示一组选中的 个点 。作者将调整后的Bboxes与选中的点结合,创建精炼的提示集:。

随后,将这些精炼的提示作为输入传入 MPA-MedSAM,其中它们成为引导进一步优化分割输出的重要输入。通过利用这些改进的提示,作者的方法可以提高分割的准确性,减少错误,并生成更精确的结果。这个过程确保模型从提供精炼提示的增强指导中受益,最终导致卓越的分割性能。精炼的提示随后作为输入传入 MPA-MedSAM 和 UGPM 功能,可以表示如下:

, 是基于 UPGA 的分割 Mask , 是相关的不确定性图。

最后,作者通过实现主动学习(Active Learning)的原则对改进后的过程进行评估:作者在实现提示优化的过程中评估输出不确定性,并仅在优化导致不确定性估计减少时更新分割结果。值得注意的是,直到对最终的输出进行严格的验证,以确保性能确实有所提高,最后的结果才被视为确定性结果。可以表示为:

提出的算法MedSAM-U的详细信息如下。

算法1 提出的MedSAM-U算法:

picture.image

IV Experiments and Results

Datasets & Loss & Implementation Details

Iv-A1 Datasets

为评估作者提出的MedSAM-U方法的有效性,作者选择了五种不同的2D医学成像模态,包括皮损镜检查(Dermoscopy),CT,MRI,结肠镜检查(Colonoscopy),超声(Ultrasound)。每个模态都由一个单一的数据集表示,具体情况如下。

皮损镜检查(Dermoscopy):ISIC-2017 [37] 是在医学图像计算与计算机辅助干预(MICCAI)会议上托管的皮肤病变分割数据集,用于黑色素瘤检测,包括2594 annotated images。

超声:CT2US [38] 是专门为使用跨模态迁移学习进行肾脏分割设计的数据集。它包括配对的CT和超声图像以及相应的肾分割标注,旨在提高超声图像中有限数据下的分割准确性。该数据集共有4586个样本,统称为肾。

CT:在这项研究中,作者使用开源的分割数据KiTS23 [39] 进行评估。由于该数据集主要用于3D分割任务,作者将其改编为执行2D分割。为实现这一点,作者在每个体积的z轴上提取切片,关注每个体积的中心区域,并按固定间隔选择切片,以确保具有代表性的、可管理的数据集,共有3882个样本。

MRI:在这项研究中,作者使用公开的2021 BraTS 2021年脑膜瘤分割MRI数据集进行评估。由于只有训练数据集包括GT分割 Mask ,这使其适合自动评估类似于SAM [6]的单张图像输入的点- Mask 任务,因此作者只使用训练数据集进行当前评估。为了评估作者的方法在支持交互式临床治疗规划方面的潜在能力,以及由于模型仅输入单张图像,其分割准确性存在限制,作者使用T1模式MRI序列作为输入进行分割精度评估。作者沿z轴提取所有切片图像及其相应的 Mask ,在间隔处选择中间切片将3D图像转换为2D切片,共生成4586个样本。随后,作者在图像索引上随机划分数据,将0.8用于训练,0.2用于测试。

结肠镜检查(Colonoscopy):作者使用Kvasir-SEG数据集 [1],它包括1000个息肉图像及其对应由奥斯陆大学医院(挪威)的专家内镜医生标注的GT Mask 。

所有数据集均用于评估。设定为3。基于地物矩形和大小,产生了Box提示。长宽随机调整以模拟手动提供的框提示。

Iii-A2 Loss function

在作者的方法中,为了训练MPA使其能够适应各种类型的提示,作者利用了二进制焦损失函数[40]与 dice损失函数[41]的组合来有效地监督训练过程中的输出,遵循参考文献[42]。这种组合损失函数是为了应对分割任务中类不平衡和准确的边界划分挑战。损失的计算公式如下:

其中:

代表输入图像,表示MPA-MedSAM预测分割结果,包括Bbox提示和点提示。 denotes its probability for pixel, and represents the model parameters needed to update; denotes the ground truth label for pixel .

Iii-A3 Implementation Details

在交互式分割中,作者在模型训练过程中使用了BBox提示与点提示。在本研究中,作者遵循MedSAM对于2D医学图像训练的默认训练设置。将五个不同模态的数据集作为输入,作者对模型进行60轮训练。作者选择的epoch数量比完全微调训练要小。在交互式模型中,在初始步骤模拟用户点击以初始化提示时,作者尝试了各种提示设置。这些包括:

(1)随机3个正点,标记为3P;

(2)随机5个正点,标记为5P;

(3)随机10个正点,标记为10P;

(4)目标区域重叠度为50%的3个BBox,标记为3B (0.5)

(5)目标区域重叠度为75%的3个BBox,标记为3B (0.75)

(6)由3个点和3个BBox标注(重叠度为0.5或0.75)组成的多类型提示,称为3P & 3B (0.5),和3P & 3B (0.75)。同样,这种方法可以应用到其他情况。所有实验都使用PyTorch平台并在单个NVIDIA 4090 GPU上进行训练/测试。

作者使用三个常用的评价指标:Dice系数(Dice)和交迭并重(IoU)。Dice计算预测与GT之间的重叠,即预测和GT的面积之和的两倍除以预测和GT的面积之和。IoU衡量预测和真实区域的重叠部分与预测和真实区域的所有重叠部分的比率。

Comparisons with the SOTA methods on Multi-modality Images

为了验证作者提出的方法的总体性能,作者在五个不同的模态上与最先进的分割基础模型进行了比较。如表1所示,还包括与SAM[6]和完全微调后的SAM在医学( MedSAM)[7]上的比较,使用Dice得分和IoU评分评估。结果如表1所示。

picture.image

首先,在对相同模型在不同Bboxes质量(0.5至0.75之间的比例)进行比较时,SAM在所有成像模态上都明显改善,当Bboxes比例从0.5增加到0.75时。MedSAM也呈现出相似的趋势,具有与Bboxes质量更高的性能提升。这说明Bboxes的质量对分割性能有显著影响,表明模型对Box提示的质量敏感。

此外,对于作者提出的MedSAM-U 3B(0.5)和3B(0.75),在表1的第五行和第六行中展示,在皮脂镜、结肠镜、超声和CT等所有医学分割任务的SOTA性能,平均Dice分别为90.9 %、90.3 %、95.8%和78.3%(3B(0.75)),分别比MedSAM高4.8%、2.3%、2.7%和2%。当Bboxes重叠比例为0.5时,作者的方法优于MedSAM,提高了20.5%。表1中的结果表明,即使初始Box提示质量较低,分割性能仍然可以显著改善。这证明了作者的方法在提高分割精度方面具有有效性,特别是在初始Bx提示质量不佳的情况下。这些结果表明,MedSAM-U在各种医学分割任务中可以使用低质量的Box,无需手动自动调整即可获得满意结果。

图3可视化了一些方法在不同的模态下的分割结果示例,其中Box模拟了不同程度的粗糙近似,模拟了专家标注。SAM和MedSAM的分割基于单步,当提供的专家Bbox提示不完全准确时,分割可能会出现欠分割或过分割错误。相反,MedSAM-U可以在不同的成像条件下准确分割各种目标。

picture.image

Ablation Study

论文中"Ablation Study"部分的开始。

V-C1 Effectiveness of Multi-Prompt Combinations

在作者的方法中,引入了MPA(多提示集成),将不同的提示类型(如点和 Box )集成到MedSAM中,从而实现同时输入各种提示组合。为了验证MPA-MedSAM模块的有效性,作者在五个不同的数据集上使用各种提示组合的分割结果展示了不同的交互式分割模型的分割效果,详细数据如下表2所示。首先,作者使用3B(0.5)提示的结果作为SAM,MedSAM和MPA-SAM在标准医学图像数据集上的多提示分割的 Baseline ,具体如下表2的第三行第七行和第十一行的第三行。

picture.image

通过分析SAM和MedSAM的结果从第三行到第四行以及从第七行到第八行,可以明显看出,提示组合中的点和 Box 的组合导致了SAM和MedSAM的Dice分数从52.6%降低到44.8%,从63.3%降低到37.7%。表格的分析结果表明,SAM和MedSAM的性能并未在加入多类型提示后得到提高。此外,使用点提示可能会对 Box 的提示产生负面影响,导致分割性能恶化。另外,引入MPA后,作者观察到MPA-MedSAM在11行和12行之间的性能提高了约3.5%,进一步证明了不确定性引导提示适应的有效性。

作者对提出的UGPA的有效性进行了全面的消融研究,结果如下表3和表4所示,其中第一行( Baseline )代表用户提供的低质量Bbox随机偏移的初始输入MedSAM-U,没有使用U-g。如表3和表4中的第二行和第三行所示,将 Box 提示与点提示结合使用,与使用不带UGPA的初始3Bbox相比,有改进。联合方法也彰显了相对于单独优化Bbox的改进,在3B(0.5)和3B(0.75)设置下,都取得了增强的性能。

picture.image

picture.image

此外,作者在图4中展示了作者方法在不同的模式下的分割结果。三个 Box 是通过在GT框的位置和形状上引入变化来模拟用户的输入,作为作者提出的MedSAM-U方法的输入。在MedSAM-U提供的细化下,结果显示出了显著的改进。该方法有效地利用了不确定性图,增强了分割的准确性和稳健性。

picture.image

V Conclusion

在本研究中,作者提出了一个新的模型MedSAM-U,该模型采用基于不确定性的自动精细化的多提示方法,用于实现可靠且准确的分割医学图像。首先,作者将MPA-MedSAM用于适应MedSAM的各种多提示策略。

然后,作者实现了UGMP,在不需要添加额外训练参数的情况下估计分割结果的不确定性。

关键是作者开发了一种用于自动生成可靠提示的新颖不确定性引导多提示自适应方法,从而实现高度准确的分割结果。此外,通过在多个模态数据集上进行训练,MedSAM-U可有效作为通用的图像分割模型。在五个不同的模态数据集上的实验结果表明,在0.5到0.75的边界框重叠比例范围内,与基本MedSAM模型相比,MedSAM-U的性能显著提高,平均改进范围为1.7%到20.5%。

此外,作者的结果还表明,初始边界框质量越低,MedSAM-U所实现的改进越大。

未来,作者的研究将集中在两个关键领域。

首先,作者计划直接在 Adapter 中估计不确定性。其次,作者旨在利用这种不确定性实现自动高级标注,使AI和模型能够在不干预人的情况下自动进行标注。

参考

[1].MedSAM-U: Uncertainty-Guided Auto Multi-Prompt Adaptation for Reliable MedSAM.

点击上方卡片,关注 「AI视界引擎」 公众号

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论