超越 DSC!UCDSC携不确定性损失项刷新医疗影像开放集识别SOTA !

机器学习算法图像处理

点击下方卡片,关注「AI视界引擎」公众号

( 添加时备注:方向+学校/公司+昵称/姓名 )

picture.image

picture.image

Image

得益于深度学习的发展,计算机辅助诊断取得了显著进展。然而,在受控实验室环境之外,算法可能面临诸多挑战。在医疗领域,这些困难通常源于数据获取受限——由于伦理和法律限制,以及专家标注成本高昂且耗时,尤其是在面对新兴或罕见疾病时。

在此背景下,开放集识别(openset recognition)发挥着至关重要的作用,其目标是判断样本是否属于训练阶段所见的已知类别,或应被拒绝为未知类别。

近期研究表明,深度神经网络后期阶段所学习到的特征会聚集在其对应类别均值附近,而这些类别均值本身则构成一个正单纯形(regular simplex)的各个顶点 [32]。本文08196设计了一种损失函数,通过利用辅助数据集对开放空间区域进行惩罚,从而有效拒绝未知类别的样本。

该方法在四个 MedMNIST 数据集——BloodMNIST、OCTMNIST、DermaMNIST、TissueMNIST 以及一个公开的皮肤数据集 [29] 上均取得了显著的性能提升,超越了当前最先进的技术。

  1. 引言

开放集识别(Open-Set Recognition, OSR)形式化地描述了分类器必须处理训练过程中未见类别的场景。尽管闭集分类假设训练与测试阶段共享一个完全已知的标签空间,但OSR通过允许在推理阶段出现未知类别,承认了现实世界数据的开放性本质 [17, 39]。换言之,模型不仅需要正确分类来自已知类别的输入(在训练中见过的类别),还必须能够检测或拒绝来自未知类别(完全新出现的类别)的输入 [35]。在推理阶段,OSR模型通常会为未知样本分配一个特殊的“未知”标签,或采用置信度阈值策略。

为了提升深度神经网络模型的分类性能,大量研究致力于最大化类间边界。该领域的近期方法可大致分为两类,依据边界最大化是在欧氏空间还是角度空间中进行 [12, 43]。在欧氏空间中操作的方法旨在通过欧氏距离度量减少类内距离,同时增大类间距离,这类方法通常在推理阶段使用。相比之下,基于角度空间的方法则依赖余弦相似度,专注于最大化类别之间的角度边界,以增强分类过程中的判别能力。

在医学影像领域,开放集识别(OSR)由于临床环境固有的开放集特性而发挥着至关重要的作用。在临床实践中,罕见疾病、成像伪影或此前未被识别的病理情况频繁出现。在封闭集假设下训练的诊断深度学习模型,可能会对这些不熟悉的情况自信地分配错误标签,从而导致误诊,并可能带来严重的临床后果。将OSR机制整合到医学影像工作流中,使系统能够识别分布外(out-of-distribution)或新颖的输入,从而促进更安全、更可信的AI辅助决策。

尽管神经网络在图像分类任务中取得了显著成功,但在医学影像领域仍面临重大挑战,尤其是在应对新兴的罕见病或新发疾病时。这些挑战因标注训练数据集的可用性有限以及数据收集不完整而进一步加剧。近期的理论研究揭示,在训练的最后阶段,深度神经分类器倾向于表现出一种几何收敛现象:最后一层的特征表示会坍缩至各自类别的均值,而这些类别均值与相应的分类器权重向量共同对齐于一个等角紧框架(equiangular tight frame, ETF)的顶点。这一现象被称为神经坍缩(Neural Collapse, NC)[32]。

08196基于在单纯形ETF(simplex ETF)中观察到的神经坍缩(Neural Collapse)现象,联合优化ResNet18/34作为主干网络(Backbone)与所提出的损失函数(公式(5))。本文的主要贡献总结如下:

  1. 作者提出的框架通过将类别中心与正单纯形(regular simplex)的顶点建立一一映射,同时引入欧氏距离(euclidean distance)和角度距离(angular distance),构建了深度单纯形分类器(Deep Simplex Classifier, DSC)[6],并将其应用于医学图像数据集。
  2. 作者提出的损失函数包含一个感知不确定性的正则化项,该正则化项惩罚任意两个类别中心之间的开放空间(open-space),从而提升对未知类别样本的拒识性能。
  3. 作者提出的损失函数还包含一个用于辅助数据集的组件,用于将未知类别区域从已知类别中心处推开。
理论基础

其中,

为经验分类损失,

衡量的是有多少开放空间被错误地 Token 为已知类别。该公式设计旨在促使分类器缩小训练数据周围的决策区域,以避免对未知样本的错误 Token 。

为降低开放空间风险,Scheirer 等人 [36] 提出了紧凑衰减概率(Compact Abating Probability, CAP)模型,该模型强制类别概率随着远离已知样本而衰减,通常基于极值理论(Extreme Value Theory, EVT)[11] 进行建模。其中一个典型例子是极值机器(Extreme Value Machine, EVM)[33],它对特征空间中的距离拟合 Weibull 分布,通过估计尾部概率来检测新奇样本。

总之,OSR通过惩罚训练数据未覆盖区域的决策来扩展统计学习,从而连接了分类与异常检测。

  1. 相关工作

开放集识别(Open-set Recognition, OSR)旨在正确分类来自已知类别的测试样本,同时拒绝那些在训练过程中未见过的未知类别样本。Scheirer 等人 [35] 首次形式化了 OSR 的概念,指出了传统闭集分类器的局限性。通常情况下,OSR 方法需同时实现两个目标:准确分类分布内的样本,并拒绝或延迟处理分布外的样本。Geng 等人 [17] 精炼地概括了这一双重目标:“OSR 要求分类器不仅能够准确分类已见类别,还需有效处理未见类别”。

随后,Bendale 和 Boult [4] 提出了 OpenMax 模型,该模型通过基于激活向量的统计建模机制,用以检测未知类别,替代了传统的 softmax。一种简单的 Baseline 方法是设定 Softmax 置信度阈值:若输入的最大 Softmax 分数低于该阈值,则将其 Token 为“未知”。然而,原始的 Softmax 分数在面对异常值时往往表现出过度自信 [24]。OpenMax [4] 及其变体 G-OpenMax [53] 采用极值理论(Extreme Value Theory, EVT)校准 [34, 42] 替代 Softmax。Shu 等人提出 DOC [38],该方法为

个已知类别部署

个 1-vs-rest sigmoid 函数,并根据对应的概率阈值判断样本是否被接受或拒绝。基于重建的模型如 CROSR [50] 和 C2AE [31] 则通过学习辅助解码器来重建已知样本,将重建误差作为新颖性(novelty)的 Agent 指标。

与端到端的深度神经网络(DNN)方法不同,开放集识别(OSR)方法同样利用特征空间中的距离度量来检测未知类别。经典方法通过为最近原型(nearest-prototype)或最近邻(nearest-neighbor)分类器引入拒绝规则来实现。Bendale & Boult [3] 提出的最近非离群点(Nearest Non-Outlier, NNO)方法扩展了最近类均值(Nearest Class Mean, NCM)分类:若输入样本位于某一类特定半径内,则将其分配给距离最近的类均值;否则,将其拒绝为未知类别。

开放集最近邻(Open-set Nearest-Neighbor, OSNN)[26] 分类方法在标准

-NN 的基础上引入距离比测试:若到最近邻与第二近邻(来自不同类)的距离比超过阈值,则对该样本进行分类;否则 Token 为未知。这种最近邻距离比(Nearest-Neighbor Distance Ratio, NNDR)规则可有效过滤模糊样本。更复杂的度量方法是极值机(Extreme Value Machine, EVM)[33],该方法使用威布尔(Weibull)分布对每个训练样本的边界距离进行建模。在测试阶段,EVM 根据样本的距离计算其属于每个已知类的概率,并在所有类的概率均低于阈值时拒绝该样本。近年来,神经坍缩(neural collapse)现象 —— 即深层特征收敛至规则单纯形(regular simplex)上的类均值 [32]——启发了若干基于嵌入几何对齐的新型 OSR 方法,用于区分未知类别 [18, 40, 49, 52]。

在医学影像领域,OSR(开放集识别)技术直到最近才开始被探索。MedMNIST基准(一 GroupNorm 的2D和3D生物医学图像数据集集合)常被用于OSR方法的原型设计 [47]。例如,Jia等人 [20] 在MedMNIST v2的子集(如ChestMNIST、OCTMNIST、PneumoniaMNIST)上评估了开放集模型,结果表明基于知识蒸馏的网络能够提升这些任务上的OSR准确率。Wang等人 [44] 通过引入不确定性启发的开放集(Uncertainty-Inspired OpenSet, UIOS)框架来解决视网膜疾病分类问题。该方法利用证据深度网络(evidential deep networks)[37] 同时估计类别概率和预测不确定性,有效识别出分布外(OOD)输入,如罕见疾病或成像伪影。尽管取得了显著进展,但在数据受限和类别间相似性较高的情况下,构建鲁棒的开放集识别模型仍是医学人工智能领域持续面临的挑战。该研究强调,OSR在各类医学场景中至关重要,可避免因不熟悉病例导致的误诊,并确保在不确定情况下安全地将诊断任务转交人工专家。

生成式开放集识别(OSR)模型通过生成伪未知样本或建模数据密度来实现。G-OpenMax [16] 和 OSRCI [30] 利用生成对抗网络(GAN)训练时引入合成的未知样本。OpenHybrid [51] 则联合训练一个卷积神经网络(CNN)分类器与基于流的密度估计器。原型学习(prototype-based learning)的进展推动了开放集识别的发展,促进了结构化特征空间的构建。GCPL(卷积原型学习,Convolutional Prototype Learning)[46] 为每个已知类别使用原型表示,并引入原型损失(prototype loss)促使嵌入向量聚集在其对应中心附近。这虽然降低了类内方差,但并未显式建模未知样本,导致未知样本可能占据与已知类别相同的区域。此外,原型在训练初期可能漂移到包含未知样本的区域,从而增加开放空间风险。

RPL(Reciprocal Point Learning)[8] 通过采用 1-vs-rest 策略训练可学习的互惠点(reciprocal points)来建模类间空间。这种方法提升了对开放空间的认知能力,但施加了固定边距约束,并忽略了类内样本之间的角度关系,导致方法对边距大小和初始化方式较为敏感。这些局限性由 DSC [6] 所解决,其引入了类内损失(intra-class loss),将同类别样本拉近至其类中心,同时将类中心固定在单纯形 ETF(Equiangular Tight Frame)的顶点上。这一设计确保了类间最大角度分离,无需显式引入类间损失项。然而,DSC 仅部分解决了未知样本拒绝的问题,其通过在辅助背景样本数据集上进行训练来实现。

ARPL(Adversarial Reciprocal Point Learning)[9] 通过引入对抗性边界约束(adversarial margin constraint)、基于角度的相似性(angle-based similarity)以及开放空间正则化(open-space regularization),扩展了 RPL,以防止已知类别与未知类别区域之间的重叠。此外,该方法通过对抗学习生成混淆样本(confusing samples),用以模拟域偏移(domain-shifted)的未知样本,并根据已知类别的数量自适应调整特征空间的大小。作者对文献[9]中提到的

(Confusing Samples)方法进行了评估,以与08196进行对比。与采用合成增强(synthetic augmentation)的方法不同,作者采用不确定性损失(uncertainty loss)来恢复被误分类的未知样本,从而仅利用学习到的判别性信号实现更优的分离效果。

DIAS(Difficulty-Aware Simulator)[28] 采用生成式方法,通过一个 Copycat 生成器模拟不同难度的未知样本,该生成器模仿分类器的行为。这种方法使分类器暴露于难以区分的未知样本中,有助于维持决策的校准性。相比之下,08196不依赖生成机制;相反,作者引入了类内、异常三元组(outlier triplet)和不确定性损失,以强化决策边界的结构,并在开放集条件下降低模型的过度自信。

OMCL(Open Margin Cosine Loss)[23] 通过显式利用嵌入空间的结构来解决开放集识别问题,其中已知类特征被鼓励聚集成紧凑簇,而Sparse区域则被视为未知类。它结合了Margin Loss with Adaptive Scale(MLAS)和Open-Space Suppression(OSS)来实现这一目标。MLAS 引入了角度边界(angular margin)和可学习的缩放因子,以增强类内紧凑性和类间可分性。OSS 进一步通过生成合成描述符来填充特征空间中的Sparse区域,并显式地将这些合成描述符归类为未知类,从而提升开放集检测性能。然而,OMCL 基于一个假设:已知类在特征空间中占据密集区域,而未知类位于Sparse区域。当未知类在特征空间中与已知类存在一定接近性时,该方法可能失效。08196通过引入不确定性感知项,对类中心之间的开放空间进行惩罚,从而有效缓解这一问题。

picture.image

Image

与上述方法相比,08196结合了三种互补的目标函数:类内损失(intra-class loss)、异常Triplet Loss(outlier triplet loss)和不确定性损失(uncertainty loss)[5],在提升类别紧凑性、最大化类别可分性、增强对困难未知样本的拒识能力以及降低开放空间风险方面实现同步优化。该集成的判别性框架在无需对抗训练、生成建模或调节多个超参数的情况下,能够在各种开放集环境中保持稳定且可解释的性能。表1总结了多种前沿方法在使用辅助数据集、合成样本以及显式建模开放空间方面的相关信息。

  1. 方法

在开放集识别(Open-Set Recognition, OSR)中,分类器最初仅使用已知类别的样本进行训练。在测试阶段,它们必须同时对已知实例进行分类,并检测和拒绝先前未见过的实例 [35]。早期的 OSR 方法在训练过程中仅依赖已知类别的数据。然而,近期研究发现,引入一个包含不同于已知目标类别样本的背景数据集,可以显著提升性能 [7, 13, 17, 27]。在本文提出的损失函数中,作者采用“

Random Images”数据集 [15, 19] 作为背景样本(该数据集是公开可用的 Tiny ImageNet [15] 数据集的一个小型子集),以强制未知类别区域与已知类别中心之间的分离。

picture.image

Image

正如引言部分第1节所述,由于神经坍缩(neural collapse)现象,各类别的均值向量及其对应的分类器权重向量会与正则单形(regular simplex)的顶点对齐,该单形构成一个等角紧框架(equiangular tight frame, ETF)。在08196中,该正则单形被外接于一个超球面(hypersphere)上,如图1所示(以2D超球面外接等边三角形为例)。此处的2D表示仅用于可视化目的。该超球面的半径由扩展因子(expand factor)表示,扩展因子是本文所提出模型中的超参数。

令训练数据集样本对的深度神经网络特征表示为

,其中

为已知类别数量。作者假设特征维度

满足

。在此条件下,与类别中心相关的损失函数可表示为:

其中,

表示类别

的目标向量(单纯形顶点)[6]。该公式在训练过程中促使学习到的特征尽可能与对应的类别中心对齐。

,表示第

个背景样本的深度神经网络特征。为了将这些背景样本融入训练过程,引入一个额外的损失项,以将背景特征推向远离固定的已知类别中心的方向:

其中

表示一个边缘超参数。第二个损失项

包含一个边缘约束,要求已知类别样本与其对应类别中心的距离,相较于背景类别样本,至少要小一个最小边缘

与任何基于最近中心点的算法一样,从开放集分类的角度来看,类别中心之间的开放空间构成了最大的风险[17]。为此,作者在上述损失函数中进一步引入了不确定性感知项

,该损失项对类别中心之间的开放空间进行惩罚。该

受启发于文献[5],其与距离最近类别中心的距离和到所有其他类别中心平均距离之比

成正比。本质上,

反映了样本与已知类别之间的相似性。当

时,表示测试样本的隐空间表示到所有类别中心(正单纯形的顶点)的距离相等,这可被解释为不可分类,从而对测试样本施加更高的惩罚。若

,则表示测试样本的隐空间表示恰好位于某个类别中心,意味着分类完全无歧义。在 MedMNIST [48] 数据集上使用该损失函数,作者观察到性能指标(AUROC、OSCR 和 Accuracy)相较于当前最先进方法有显著提升。

:最近类别中心的索引

作者使用损失函数

对模型进行了评估,该函数是

的线性组合。当

取值在 0.1 到 1.5 之间,

取值在 5 到 10 之间时,取得了最佳结果。

  1. 实验与结果

作者首先详细介绍实验设置,随后给出结果与讨论。源代码可访问 https://github.com/Arnavadi19/UCDSC

4.1 实验设置

作者首先简要介绍本研究中使用的不同数据集,随后阐述实现细节。

4.1.1. 数据集

作者使用 MedMNIST v2 数据集 [48] 和增强型皮肤病变图像数据集 [29]。在 MedMNIST 数据集中,所有图像均被调整为

尺寸,并使用官方提供的训练集和测试集划分,适用于全部四个数据集。每个数据集在每次试验中均划分为已知类别和未知类别。在每次试验中,已知类别的图像用于训练和闭集评估,测试集中属于未知类别的图像用于开集评估。作者使用背景样本作为辅助数据集,以区分未知类别与开放空间中的样本。作者采用 [15, 19] 中使用的“300k Random Images”数据集作为背景样本。

BloodMNIST [48] 是一个包含单个正常血细胞显微图像的数据集。该数据集源自 [1, 2]。图像来自无感染或血液系统疾病个体,共分为 8 个类别。数据集包含 17,092 张彩色图像,经过中心裁剪并缩放至

OCTMNIST [48] 源自一个视网膜OCT数据集 [21, 22],包含 109,309 张灰度图像,分为 4 个诊断类别。图像经过中心裁剪并缩放至

DermaMNIST [48] 源自 HAM10000 数据集 [10, 41],该数据集是一个多源皮肤镜图像集合,涵盖了 7 种常见皮肤疾病。它包含 10,015 张彩色图像,均被重缩放至

TissueMNIST [48] 源自 Broad Bioimage Benchmark Collection 中的 BBBC051 数据集 [25, 45]。该数据集包含 236,386 张分割后的有人类肾皮质细胞的灰度图像,共分为 8 个类别。每张 3D 图像

沿轴向(切片)维度通过最大强度投影(maximum intensity projection)降维为 2D 图像,并调整大小为

以供使用。

Augmented Skin Conditions Image Dataset[29] 是一个专注于六种常见皮肤状况增强图像的集合。该数据集包含 2,394 幅图像,每种皮肤状况(痤疮、癌变、湿疹、角化症、粟丘疹和玫瑰痤疮)各有 399 幅图像。图像尺寸可变,反映了真实世界医学图像的特征。

4.1.2. 实现细节

为了在封闭集和开放集场景下评估性能,作者采用三个关键指标。准确率(Accuracy, ACC)用于验证封闭集分类性能,计算方式为正确分类样本数占所有测试样本的比例。受试者工作特征曲线下面积(Area Under the Receiver Operating Characteristic curve, AUROC)[14] 是一种与阈值无关的指标,用于评估模型区分已知样本与未知样本的能力。它反映了随机选取的一个已知样本被赋予高于随机选取的一个未知样本置信度的概率。然而,AUROC 未考虑对已知类别的正确分类。为弥补这一局限,作者额外采用开放集分类率(Open Set Classification Rate, OSCR)[13],该指标同时考虑开放集识别与封闭集分类性能。OSCR 曲线在不同阈值下绘制正确分类率(Correct Classification Rate, CCR)与误报率(False Positive Rate, FPR)的关系,全面衡量模型在正确分类已知样本的同时拒绝未知样本的能力。OSCR 得分即为 OSCR 曲线下的面积。OSCR 得分越高,表明模型的开放集分类性能越优。

picture.image

Image

作者将所提方法与6种最先进的方法——GCPL [46]、RPL [8]、

[9]、DIAS [28]、OMCL [23] 和 DSC [6]——在 BloodMNIST、OCTMNIST、DermaMNIST 和 TissueMNIST [8] 数据集上进行了对比,结果如表2所示。其中,OMCL [23] 仅报告了 BloodMNIST 和 OCTMNIST 的结果,其余数据集因未公开代码导致结果不可获得,表2中以“–”表示。最佳和次佳性能分别以粗体下划线和粗体标注。输入模型的图像尺寸均为

。ResNet18 和 ResNet34 被用作主干网络(Backbone)。除批量大小(batch size)、学习率(learning rate)和边际(margin)超参数外,作者还对扩展因子(expand factor)进行了调优,该因子表示外接正单纯形(regular simplex)的超球半径。以下是各数据集上的实验细节:

BloodMNIST:作者使用批量大小(batch size)为512、训练轮数(epochs)为400、学习率(learning rate)为0.01来训练模型。记录到的最佳扩展因子(expand factor)和间隔(margin)分别为100和38。作者在随机选择的4个类别作为已知类、其余4个类别作为未知类的情况下进行了

次试验,并报告了所有三项指标(AUROC、OSCR 和 Accuracy)的平均值。从表2中可以明显看出,不确定性感知的深度单纯形(Uncertainty Aware Deep Simplex, UCDSC)分类器在AUROC和OSCR指标上优于其他方法,而在准确率(Accuracy)方面表现相当。

OCTMNIST:作者使用批量大小(batch size)为 256、训练轮数(epochs)为 400、学习率(learning rate)为 0.001 来训练模型。作者在随机选取的 2 个类别作为已知类别,其余 2 个类别作为未知类别的情况下进行了

次试验,并报告了所有三项指标(AUROC、OSCR 和 Accuracy)的平均值。从表2 可以看出,UCDSC 的结果与 OMCL 相当,同时优于其他方法。灰度 OCT 图像包含视网膜各层的精细结构细节,这些细节可能难以通过原型的互反点(reciprocal points)以及基于对抗的学习方式捕捉,这解释了 GCPL、RPL、

和 DIAS 方法性能较低的原因。

DermaMNIST:作者使用批量大小(batch size)为512、训练轮数(epochs)为400、学习率(learning rate)为0.001来训练模型。作者随机选取4个类别作为已知类,其余3个类别作为未知类,共进行

次试验,并报告了所有三个指标(AUROC、OSCR 和 Accuracy)的均值。从表2可以看出,不确定性感知的深度单纯形分类器(Uncertainty Aware Deep Simplex Classifier)在AUROC指标上显著优于其他方法。

此外,可以注意到,由于DermaMNIST数据集规模相对较小(仅10,015张彩色图像),与其他三个数据集相比,因此在合成数据生成方面可能并未带来性能提升,这在对比ARPL

与DIAS性能与GCPL及RPL时已得到观察。

TissueMNIST:作者使用批量大小(batch size)为1024、训练轮数(epochs)为300、学习率(learning rate)为0.001来训练模型。作者随机选取4个类别作为已知类别,其余4个类别作为未知类别,共进行

次试验,并报告了所有三个指标(AUROC、OSCR 和 Accuracy)的均值。从表2可以看出,不确定性感知的深度单纯形分类器(Uncertainty Aware Deep Simplex Classifier)在AUROC指标上显著优于其他方法。这表明,通过08196,未知类别的拒绝能力得到了更有效的实现。

增强皮肤病症图像数据集:作者使用批量大小(batch size)为16、训练轮数(epochs)为200、学习率(learning rate)为0.01的设置训练模型。作者对随机选取的3个类别作为已知类别、其余3个类别作为未知类别的情况进行了

次试验,并报告了所有三个指标(AUROC、OSCR 和 Accuracy)的均值。

picture.image

Image

所有模型均使用 PyTorch 实现,并采用 RMSProp 优化器进行训练(权重衰减/L2 正则化

,L1 正则化

,alpha 0.95,eps

,动量 0.9)。各模型在测试集上的性能表现如图4 所示,以 ROC 曲线形式呈现。

4.2 消融实验

picture.image

Image

作者考察了在 BloodMNIST、Augmented Skin Conditions (ASC) 和 TissueMNIST 数据集上,不同

取值对 AUROC、OSCR 分数及准确率的影响。从表4 可以看出,将Triplet Loss项

加入到

中(即

)时,ASC 数据集上的性能提升了

;而进一步引入不确定性感知项

(即

)后,所有指标均获得了显著提升(

5%)。其中,

表示未引入背景样本。仅将不确定性感知项

)加入

时,ASC 数据集上的性能也实现了显著提升。具体而言,当

时的结果与

时的最佳得分非常接近,这表明不确定性感知项

的贡献具有显著有效性。

picture.image

Image

在BloodMNIST数据集上,从表3可以看出,将Triplet Loss项

加入到

中(即

)可带来显著的性能提升(在

时),而进一步引入不确定性感知项

(即

)可使性能再提高

(在

时)。这表明在BloodMNIST数据集上,引入背景样本的影响更为显著。此外,作者还观察到,仅将

加入

也能在OSCR和准确率上带来显著的性能提升。

picture.image

Image

从表5可以看出,在TissueMNIST数据集上,当

时,08196达到了约 70% 的 AUROC 分数(表现出较强的稳定性)。这表明所08196在所有阈值下对已知样本与未知样本的排序能力更强。在

时取得了最佳结果。此外,从表5可见,加入背景样本后(即

),AUROC 分数有所提升,而准确率变化不大。特别地,当

时,观测到的 AUROC 和准确率分别为 70.50% 和 77.38%。

picture.image

Image

作者还在图3中展示了关于OSCR指标的超参数分析结果。OSCR分数被广泛认为是开集识别中最可靠的评估指标[13]。观察发现,对于扩展因子(expand factor)为100且批量大小(batch size)为

时,所有数据集均获得了最优的AUROC和OSCR值。然而,对于边缘超参数(margin hyperparameter),BloodMNIST、OCTMNIST和TissueMNIST在取值为35时获得了最高的AUROC值。在ASC数据集上,批量大小为

时取得了最佳结果。

  1. 结论

本文的目标是确保对已知类别实例进行准确分类,同时有效拒绝属于未知类别的样本。作者观察了所提出的 UCDSC 方法在近期医学图像数据集 MedMNIST 上的表现。UCDSC 方法在 Deep Simplex Classifier (DSC) 损失函数中引入了不确定性感知的损失项,进一步提升了在 MedMNIST 和 Augmented Skin Conditions (ASC) 图像数据集上的性能。

本研究在医疗健康领域具有重要意义,因为罕见疾病、成像伪影或此前未被识别的病理情况时常出现。作为未来工作的一部分,作者还计划将该方法扩展至类别数量可能超过固有特征维度的场景,例如癌症数据集。

点击上方卡片,关注「AI视界引擎」公众号

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
火山引擎大规模机器学习平台架构设计与应用实践
围绕数据加速、模型分布式训练框架建设、大规模异构集群调度、模型开发过程标准化等AI工程化实践,全面分享如何以开发者的极致体验为核心,进行机器学习平台的设计与实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论