结合 LRA 系数回归与锚框分类:提高光检测精度,性能 SOTA!

向量数据库大模型机器学习

点击下方卡片,关注「集智书童」公众号

点击加入👉「集智书童」交流群

picture.image

picture.image

picture.image

picture.image

picture.image

想要了解更多:

前沿AI视觉感知全栈知识👉「分类、检测、分割、关键点、车道线检测、3D视觉(分割、检测)、多模态、目标跟踪、NerF」

行业技术方案 👉「AI安防、AI医疗、AI自动驾驶」

AI模型部署落地实战 👉「CUDA、TensorRT、NCNN、OpenVINO、MNN、ONNXRuntime以及地平线框架」

欢迎扫描上方二维码,加入「 集智书童-知识星球 」,日常分享论文、学习笔记、问题解决方案、部署方案以及全栈式答疑,期待交流!

免责声明

凡本公众号注明“来源:XXX(非集智书童)”的作品,均转载自其它媒体,版权归原作者所有,如有侵权请联系我们删除,谢谢。

picture.image

自动从X光图像中测量Cobb角对于脊柱筛查和诊断至关重要。然而,大多数现有的基于回归的方法和基于分割的方法在表示脊柱或 Mask 连接/碎片化问题上存在不准确。

此外,基于 Token 的方法在训练数据和标注方面存在不足。

为了应对这些挑战,作者提出了一种新颖的框架,包括自生成 Pipeline 和低秩近似表示(SG-LRA),用于自动Cobb角测量。具体来说,作者提出了一种基于LRA的参数化脊柱轮廓表示,该表示可以实现特征脊柱分解和脊柱轮廓重建。

作者只需通过回归得到的LRA系数,就可以直接获取脊柱轮廓,这比矩形框形成更准确的脊柱表示。此外,作者将LRA系数回归与 Anchor 框分类相结合,以解决不准确的预测和 Mask 连接问题。

此外,作者开发了一个数据引擎,它以迭代方式进行自动标注和自动选择,该数据引擎训练在私人Spinal2023数据集上。利用作者的数据引擎,作者生成了最大的脊柱X光数据集,名为Spinal-AI2024,在很大程度上没有隐私泄露。

在公共AASCE2019,私人Spinal2023和生成的Spinal-AI2024数据集上的广泛实验表明,作者的方法在Cobb角测量性能方面达到了最先进水平。

作者的代码和Spinal-AI2024数据集分别可在https://github.com/Emestchenchen/Spi-AI2024中找到。

I Introduction

Sciloosis是人类重要的脊柱疾病,尤其是对于脊柱侧凸(Scoliosis),这是一种主要影响青少年的脊柱畸形,对患者的健康会产生显著影响[1,2,3]。及早发现和治疗脊柱侧凸可以帮助减少手术干预的需要[4]。Cobb角[5]是评估和诊断脊柱侧凸严重程度最广泛使用的临床测量方法之一。它定义为脊柱侧凸顶端最倾斜的椎骨(曲线的最高点)和底部最倾斜的椎骨之间的平行线之间的角度[6]。与不同的脊柱段相关的三种区域性脊柱畸形:近端胸椎(PT)、主胸椎(MT)和胸腰/腰骶(TL/L),如图1(c)所示。

目前,在医疗机构中,专家通过X光等放射影像手动测量Cobb角仍然是最主要的方法。然而,这种方法耗时且可能存在潜在错误[7, 8],因为其受到脊柱选择和观察者间变异性的影响,这在图1(a)中手动角度与 Token 角度之间的距离可见。已证实,手动标注Cobb角存在2.8至8度[9]的波动。因此,开发一个可靠的自动Cobb角测量方法至关重要。

传统的手工特征自动Cobb角测量方法依赖于手工特征,这限制了模型的性能和泛化能力。近年来,一些基于回归的方法使用矩形框作为脊柱表示 [12, 13],当脊柱块呈楔形或不规则时,其准确性会降低,如图1(a)所示。基于分割的方法对图像质量敏感,在低质量输入下,倾向于预测连接或损坏的脊柱面罩。基于标志点的方法需要大量的训练数据和标注,这既昂贵又耗时,且由于患者隐私问题,数据稀缺。

在本文中,作者将上述局限性概括为三个主要问题,并从三个方面进行解决:

(a)如何实现更准确的脊椎骨表示?

(b)如何在保护患者隐私的同时生成足够的脊柱侧弯图像?

(c)如何在低成本的情况下获得准确的标注?

参数化脊椎骨表示。作者提出了一种新颖的自动Cobb角测量框架,名为SG-LRA。作者结合了回归技术和标志点技术,通过使用一组脊椎标志点来表示脊椎节段的边界框。受到目标检测中低秩近似(LRA)参数化轮廓表示[19, 20]的启发,作者使用LRA从训练数据的脊椎轮廓中学习脊椎骨,并通过LRA系数重构脊椎轮廓。为了抑制不准确的预测并遮挡连接,作者将LRA系数回归与 Anchor 框分类集成,以获得脊椎节段轮廓,其中稀疏和密集的分配融合以更精确地检测脊椎节段。

隐私保护的脊柱侧弯图像生成。作者探索了潜在扩散模型(LDM)[21]用于脊柱侧弯图像合成。具体而言,作者在作者的私有数据集Spinal2023上训练LDM,利用扩散过程将原始图像从像素映射到潜在空间。在推理阶段,使用文本条件 Prompt 的训练好的LDM可以生成X光图像。为了减轻隐私泄露[22],作者在LDM训练期间使用数据增强,促进数据平衡,并引入隐私审查[23],根据结构相似性和像素相似性,排除可能损害隐私的样本,并进行手动验证。

有效的半监督标注方法。受半监督假标签[24]和多阶段交互标注[25]启发,作者提出了一种新的数据引擎,驱动一个迭代 Pipeline ,其中包含自动标注和选择。它包括四个阶段:假标签、自动标注、手动辅助标注和隐私审查。在每个迭代中,首先使用当前数据集重新训练脊柱轮廓检测网络,然后使用其训练好的模型进行假标签,以便进一步更新数据集。这个迭代 Pipeline 最终产生了作者开源的数据集Spinal-AI2024,这是最大的脊柱侧弯X光数据集。

本文的主要贡献有三个方面:

  1. 作者提出一种新颖的低秩近似参数化脊柱表示,用于自动Cobb角测量,其中结合了LRA系数回归和 Anchor 框分类与稀疏和密集分配,以检测脊柱节段的异常轮廓。
  2. 作者提出了一种新的数据引擎,采用半监督 Token 和隐私审查的方式进行迭代,以实现大规模脊柱X光图像的生成,同时避免隐私泄露。据作者所知,作者的开源Spinal-AI2024是迄今为止最大的脊柱X光数据集。

广泛的实验表明,在我国2019年AASCE会议、2023年Spinal会议和2024年Spinal-AI会议的数据集上,作者的方法在最大角度和三个区域角度的自动Cobb角度测量方面都优于当前最先进的方法。

2 Related Work

Scoliosis Cobb Angle Measurement

早期的方法[采用传统机器学习来近似图像特征与Cobb角之间的关系。然而,由于降采样[17]或依赖手工特征,这些方法在性能和泛化方面存在问题。近年来,基于深度学习的方法[28, 29]越来越受到关注。

回归方法的目标是学习脊椎形状表示与Cobb角之间的直接映射,无需进行显式几何计算。然而,由于矩形形状假设,这些方法在楔形或不规则椎骨上的性能有限。

基于分割的方法通常依赖于U-Net[33]或其修改[34, 15],通过进行像素级分类并将像素组合成脊椎区域。然而,这些方法对图像质量敏感,通常需要预处理以解决噪声、分辨率和对比度问题[35, 32]。

基于地标的方法关注于定位脊椎地标,这通常需要大量的训练数据。在本文中,作者通过LRA系数回归预测地标,利用作者提出的数据引擎进行自动标注和选择,从而克服了数据稀缺问题。

Medical Image Generation

深度学习严重依赖大量的标注训练数据[39]。在医学图像领域,由于图像采集和标注过程繁琐、耗时且昂贵,通常缺乏标注数据[40]。为了缓解这一限制,以前的研究采用了数据扰动[41]或数据合成[42]。

生成模型如生成对抗网络(GANs)[43; 44]已经展示了产生真实、高分辨率图像的能力[45; 46; 47; 44]。最近的研究[22]表明,扩散模型[21]具有比GANs更高的生成能力。Packer等人[23]利用LDM生成胸部X光图像,并提出了一个采样策略,以保护敏感生物信息的隐私。然而,在严格的隐私法规下共享敏感数据仍然是一个关键的挑战,在医学研究中[48; 49]。在本文中,作者也利用LDM生成脊柱侧凸X光图像。此外,作者提出了一种隐私审核模块与伪标签训练相结合的方法,利用全面的隐私相似性机制过滤可能暴露患者隐私的图像。

Semi-Supervised Labeling

半监督标注方法可分为一致性正则化和伪标签方法。一致性正则化方法[50; 51]依赖于特定模态的增强进行正则化。伪标签方法[52]为未标注数据预测标签,并在监督方式下训练模型。

Shi等人[53]采用了基于局部邻域密度置信分数的伪标签 Token 方法。受到噪声校正[54]的启发,Wang等人[55]通过优化框架更新了伪标签。Xie等人[56]证明了在监督分类任务中自训练的有效性。然而,这些方法在伪标签存在缺陷时表现挣扎。最近,Rizve等人[24]根据不确定性从噪声样本中选择高质量的伪标签。Kirillov等人[25]构建了一个数据引擎,通过手动辅助、半自动和全自动阶段来扩充数据。在本文中,作者采用了一种类似的半自动标注 Pipeline 来扩充数据集,其中伪标签选择和人工辅助相结合以提高质量。

3 Methodology

如图2所示,作者框架的架构如下。给定作者私有的Spinal2023数据集,作者首先使用Stable Diffusion [21]训练模型生成大量的脊椎X光图像。具体而言,生成过程从原始像素空间开始,经历扩散。文本条件和像素特征随后被输入潜在空间,经过交叉注意力模块生成最终输出。

picture.image

此外,作者使用Spinal2023来训练脊椎轮廓检测网络的初始模型。该网络采用ResNet50 [57]作为 Backbone ,并使用特征金字塔网络(FPN)[58]提取多尺度特征。然后,它使用回归和分类分支分别预测LRA系数和正 Anchor 框。在这两个分支中,稀疏和密集的分配相结合以提高检测性能。最后,作者选择与正 Anchor 框对应的LRA系数来重构脊椎节段轮廓。

数据引擎集成了一个循环和筛选机制。筛选过程包括像素 Level 的隐私检查、样本 Level 的合法性审查以及段落 Level 的质量评估。在每个迭代中,脊柱轮廓检测网络使用当前数据进行微调,并利用其训练好的模型进行伪标签化,以更新数据和标注。

Spinal Contour Detection via LRA

3.1.1 Parameterized Spine Representation

为了纠正先前的基于矩形盒的脊椎表示的不准确性,作者利用脊椎标志组成的轮廓盒来表示脊椎段。考虑到脊椎段通常具有相似的结构特性和明显的轮廓相关性,作者基于训练数据中的这些相关性开发了一种新的参数化脊椎轮廓表示方法。

特别是,脊椎节段的边界由 个顶点(即标志点)组成,可以表示为向量 ,其中包含 x 和 y 坐标。然后,作者从包含 个脊椎节段实例的训练数据中构建脊椎轮廓矩阵 。接下来,作者使用奇异值分解(SVD)来提取 之间的基础结构关系:

picture.image

其中 和 是正交矩阵。 是一个对角矩阵,由奇异值 组成,其中 是矩阵 的秩。

每个单维向量代表特征空间的正交方向。在式(1)中,保留前个奇异值及其对应的向量,同时截断其余低秩分量,作者可以近似表示为:

picture.image

由于 是 的最佳秩 近似,因为它最小化了 Frobenius 范数 [59]。

然后,作者定义 , 使得 可以表示为

picture.image

其中, 是 的近似值。作者称 为 eigen-spines, 因为它们是矩阵 的特征向量,可以看作是主脊椎段形状。

对于任何 维脊椎节段轮廓 ,作者可以将其投影到特征脊椎空间:

作为专业的AI学术论文翻译助手,我的任务是将您提供的英文AI学术论文翻译成准确、流畅的简体中文。确保翻译后的内容忠实于原文,同时保持学术论文的专业性和格式。请注意,我不会输出原文内容,仅提供翻译后的结果。

具体输入内容为: where is the LRA coefficient vector.

2.1.2 Spinal Contour Detection Network

如图2所示,作者的脊椎轮廓检测网络包含回归和分类分支,其中整体损失被定义为:

picture.image

其中, 和 分别表示回归和分类分支的损失, 和 控制它们的权重。 由密集配准中的脊椎区域损失 和稀疏配准中的稀疏采样区域损失 组成:

在其中, 和 分别使用交叉熵损失和聚焦损失的形式。 被定义为

picture.image

其中 表示平滑 L1 损失, 表示通过结合稀疏和密集分配获得的阳性样本区域, 表示指示函数,在条件有效时输出 1(即第 个点在公式(7)中的 内),否则输出 0。将回归和分类分支的输出结果相加,作者可以得到一个 维系数矩阵 。预测的脊椎节段位置可以通过以下方式计算:

其中, 表示检测到的脊椎节段数量。

Data Engine with Dataset Generation

作者的数据引擎由四个迭代阶段组成:伪标签、自动标注、手动辅助标注和隐私审查。在启动数据引擎之前,作者使用Stable Diffusion [21]生成一组脊椎X光图像,如图1所示。

2.2.1 Pseudo-Labeling

在第i次迭代中,为了实现伪标签,作者首先使用当前可用的 Token 数据,由和组成,其中训练好的模型参数表示为。然后,作者使用对中的样本进行 Token 。对于第j个样本,网络预测脊椎段的位置。为了过滤不准确的预测,作者使用一个置信阈值选择的正脊椎段实例:

picture.image

表示由脊髓轮廓检测网络输出的第 个脊髓节段的后验概率/置信度。

2.2.2 Auto-Annotation

作者在段落级和样本级上进行自动选择。作者移除面积小于200像素的脊椎段实例,移除非法的标志点坐标,如负值或超出图像边界的位置,以及无法形成有效轮廓的标志点坐标。在样本级上,作者丢弃样本数量少于10个的样本,其中真实数据集中每个图像的平均脊椎段数为17。作者还丢弃脊椎中心距离大于平均距离三倍的样本。

样本级选择可以过滤出生成质量较差的样本。如果选择了一个样本,则该样本的索引在中设置为1,否则设置为0。

3.2.3 Manual-Assisted Annotation

这一阶段首先为样本数量不足的样本添加标注,然后手动纠正定位不准确的实例。作者还删除了非真实的、脊柱骨折的和不清晰的样本。

3.2.4 Privacy Review

最后,作者移除在中具有过高的综合相似度(CS)的生成样本到真实样本。将的值分配以确定是否丢弃某些样本:

picture.image

表示 CS 函数, 表示 中的第 个样本, 表示 中的样本数量,而 是一个阈值。作者将 与所有实际样本进行比较,通过 进行选择,以保护每个实际样本的隐私。为了评估脊椎图像生成的患者隐私泄露程度,作者引入了记忆的定义 [22]:如果一个样本 可以从模型中提取出来,并且数据集中最多有 个训练样本 ,使得 ,那么 就被认为是 完全记忆的。在这里, 表示与 几乎相同的样本数量,可以通过设置严格的 值使其接近零。

为了衡量两幅图像在亮度、对比度和结构信息方面的相似性,作者采用结构相似性指数度量(SSIM):

picture.image

其中 和 分别表示 的均值像素值和方差, 表示 和 的协方差, 和 是常数,用于稳定除数。此外,作者定义了灰度变换后的 和 之间的像素相似度(PS):

picture.image

在这里, 表示灰度变换,而 表示灰度级数(通常为 255)。

通过结合方程(11)和(12),利用折中参数λss和λps,作者得到了CS的定义:

picture.image

在上述选择之后,作者可以使用已选择的索引集获取当前 Token 生成的数据集。然后将与现有的合并,以微调脊椎轮廓检测网络。在下一轮迭代中,作者继续生成伪标签,并重复此过程,直到收敛。

4 Experiments

Datasets and Settings

4.1.1 Datasets

作者在公共AASC2019 [11; 60]基准、私有Spinal2023和开源Spinal-AI2024数据集上评估Cobb角测量。数据集详情见表1。

picture.image

AASC2019 包含609张正面脊柱X光图像,每张图像由临床医生标注了17个脊椎节段和68个标志点,以及PT、MT和TL/L Cobb角。这个数据集展示了图像强度和Cobb角变化的广泛范围。遵循官方设置[60],作者使用481张图像进行训练,128张图像进行测试。

"Spinal2023" 是作者的私有临床数据集,包含904张脊柱X光图像。这些图像随机分为训练集700张和测试集204张。使用公共脊柱标志检测工具[17]对每个图像的17个脊柱节段的68个标志进行标注,这些标志进一步由临床专家手动检查和更正。基于脊柱标志计算PT、MT和TL/L Cobb角。大多数图像存在轻度或中度脊柱侧凸,并表现出相似的图像强度。

SpinalAI2024 是作者生成的数据集,其中包含20,000张脊柱X光图像。在这20,000张图像中,16,000张用于训练,4,000张用于测试。这个数据集的Cobb角度分布较广,且图像强度有一定范围。作者通过提出数据引擎获取了脊柱标志物的标注以及每张图像的三种Cobb角度。

3.1.2 Implementation Details

作者的SG-LRA是通过PyTorch实现的。与先前的研究工作[20]类似,作者将特征脊柱空间维度M设置为16,脊柱段顶点数量N设置为14。方程(5)中的损失权重λ_{reg}和λ_{cls}分别设置为0.1和1。作者采用随机梯度下降(SGD)优化器和高阶多项式学习率调度器,权重衰减为0.0005,动量为0.9,初始学习率为0.001。在伪标签阶段,作者的脊柱轮廓检测网络首先在Spinal2023上预训练100个周期,然后迭代地微调由Spinal2023图像和选择生成的图像组成的训练数据。置信阈值τ_{c}设置为0.3。为了隐私审核,方程(13)中的权重λ_{ss}和λ_{ps}分别设置为0.2和0.8,CS阈值τ_{CS}设置为0.6。

3.2.3 Evaluation Metrics

遵循AASCE2019[60]基准,作者报告了对称平均绝对百分比误差(SMAPE):

picture.image

和 分别表示真实值和预测值。它用于评估最大 Cobb 角的准确性,以及 PT、MT 和 TL/L 中的每个 Cobb 角。此外,作者使用目标检测指标平均精确率(AP)和平均召回率(AR),以及角度差异指标欧几里得距离(ED)来评估脊椎轮廓的迭代标签精炼效果。

Comparison with State-of-the-Art Methods

3.2.1 Maximum Cobb Angle Evaluation

表格2展示了在我国AASCE2019数据集上的比较结果。可以看出,作者的SG-LRA在AASCE2019数据集上保持了顶级性能。与基于回归的方法(如Faster-RCNN)相比,SG-LRA表现更好,原因在于作者使用LRA参数化脊柱表示进行精确的Cobb角度计算。与基于分割的方法相比,SG-LRA(稀疏和密集分配)可以更准确地检测脊柱节段轮廓,更好地解决脊柱 Mask 连接/碎片问题。与基于标志点的方法相比,作者的LRA系数回归与 Anchor 框分类分支结合可以更准确地定位角落点,为非矩形脊柱节段提供了更强的鲁棒性。

此外,作者在图3中可视化了不同的脊椎表示。可以看出,作者的LRA参数化脊椎表示比基于 Token 点和矩形 Box 的表示更加精细,从而可以实现更精确的Cobb角度计算。

3.2.2 PT, MT, and TL/L Cobb Angle Evaluation

作者在表3中评估了三个区域脊柱曲线的Cobb角,进行了更详细的比较。由于Spinal-AI2024的构建涉及作者的脊柱轮廓检测网络,SG-LRA在Spinal-AI2024上的报告结果是通过在Spinal-AI2024上重新训练脊柱轮廓检测网络获得的。可以看出,作者的SG-LRA在大多数情况下显著优于以前的工作。

picture.image

特别是在所有三个数据集上,SG-LRA在MT和TL/L Cobb角度以及最大Cobb角度上表现最好。这主要归功于LRA系数回归和 Anchor 框分类的结合。需要注意的是,对于PT校正的性能并不理想,这可能是因为SG-LRA更注重定位不规则的脊椎段而不是限制预测的脊椎段数量。因此,在计算PT Cobb角度时可能涉及到颈椎,导致结果更差。尽管之前的方法预测了17个脊椎段,通常可以获得更准确的PT预测,但需要进行复杂的数据预处理和基于临床知识的标注。

可以看出,基于分割的方法Residual U-Net在Spinal2023上实现了最佳PT Cobb角估计结果,而基于landmark的方法Linformer在Spinal-AI2024上实现了最佳PT Cobb角估计结果。作者注意到,Spinal2023的图像数量有限,而Spinal-AI2024的图像规模更大。在这种情况下,landmark方法在Spinal2023上的训练数据不足,但在Spinal-AI2024上可以训练得很好,而基于分割的方法在较小规模的Spinal2023上具有更大的优势。相比之下,作者的SG-LRA在小型和大型数据集上都能持续有效工作。

Ablation study

在本节中,作者将评估作者框架中的关键模块:脊椎轮廓检测网络和数据引擎。

3.3.1 Spinal Contour Detection Network

作者的脊柱轮廓检测网络包括LRA系数回归分支和 Anchor 框分类分支,每个分支都包含稀疏和密集的分配。表4展示了在Spinal2023上的不同变体的结果。

picture.image

回归和分类分支。作者可以看到,仅使用分类或回归分支都无法取得良好的性能,其中回归分支更为重要。当将两者结合时,作者的全脊椎轮廓检测网络实现了最小的SMAPE。

《稀疏和稠密分配》在将两分支合并时,仅使用稀疏或稠密分配仍无法实现所需的Cobb角测量效果。由于预测更加细致,稠密分配的准确性高于稀疏分配。

3.3.2 Data Engine

在作者的框架中,由Stable Diffusion [21]生成的X射线图像存在一定程度的噪声,其中一些严重的噪声不符合实际情况。这个问题在医学图像生成领域很常见,由于训练数据的分布特性本身,包括像Cobb角大于45度这样的罕见案例的缺乏。作者的数据引擎旨在解决这个问题,并在本节中进行验证。

不同置信阈值. 为了研究不同的置信阈值的影响,作者在第一次数据引擎迭代时使用不同的(0.1间隔),在上训练脊椎轮廓检测网络,如图4所示。结果表明,将设置为0.3可以获得最高的伪标签质量。当较低时,选择的脊椎段实例可能包含更多噪声,这会使得进一步去噪过程复杂化。当较高时,重要阳性实例可能被遗漏,导致在计算Cobb角度时产生较大误差。

picture.image

《去噪在自辅助标注与手动辅助标注中的去噪》表5展示了在去噪前后,当前标签与最终Spinal-AI2024中的标签之间的AP和AR计算结果。数据显示,去噪显著提高了伪标签的质量。

picture.image

《不同的样本选择策略》作者在表6中展示了使用不同的样本选择策略进行的三个实验。如果一个样本被筛选并将不会在下一轮中被选择,即累积方式,那么整体最高质量改进可以实现。如果在各个迭代阶段独立更新,那么质量改进会变得更糟,但仍然优于不进行筛选。这证明了结合去噪和隐私审查过程的累积有效性。

picture.image

作者还在图5中呈现了在样本选择过程中筛选出的过滤脊椎段实例和不合理的样本。可以看出,不准确的伪标签和生成的样本被剔除。

V AI Responsibility and Ethical Standards

这项研究的目的是提高自动Cobb角度测量在脊柱侧弯诊断中的准确性和安全性。在引入这项技术时,仔细的数据审查和遵守伦理标准至关重要。对AI生成的数据进行彻底的隐私审查是保护患者信息和权益的必要条件。在学术界,遵守最高的伦理原则是研究行人的基本责任。

Data Availability

本论文使用的数据集包括公共AASCE2019基准数据,作者的私有Spinal2023数据集,以及作者生成的Spinal-AI2024数据集。Spinal-AI2024已在https://github.com/Ermestchenchen/Spinal-AI2024\_上发布。由于Spinal2023涉及患者隐私,因此无法公开发布,但本文提供了关于数据来源、数据处理和数据分布的许多详细信息。此外,Spinal2023在严格的数据显示协议下使用,并得到机构医学研究伦理委员会的批准。Spinal-AI2024进行了隐私评估,以防止患者重新识别。

Data Ethics

V-B1 Public AASCE2019

利用这个基准数据集,作者可以客观评估和比较作者的自动Cobb角度测量技术。重要的是,AASCE数据集已经进行了适当的匿名化和去识别,以保护患者隐私,这与相关的伦理指南和法规保持一致。

V-B2 Private Spinal2023

此外,本研究还利用了私人Spinal2023数据集,该数据集包含X光图像和Cobb角度标注,用于更大的脊柱侧弯患者队列。在严格的的数据使用协议下,与全面的隐私和保护协议的审查和批准,由机构医学研究伦理委员会审查和批准。

V-B3 Generated Spinal-AI2024

本数据集是由在Spinal2023上训练生成AI模型合成额外X光图像和Cobb角度标注而创建的。研究团队仔细审查并验证了Spinal-AI2024数据集,以确保其保留了原始数据特征。

纳入脊椎AI2024数据集扩展了训练和评估数据,这可以提高自动Cobb角度测量算法的鲁棒性和泛化能力。然而,使用AI生成的数据需要考虑额外的伦理问题。作者已经实现了严格的数据溯源跟踪、算法透明度和人工监督,以验证脊椎AI2024数据集的完整性和忠实度。还进行了全面的隐私评估,以防止潜在的患者重新识别。

对于每个Spinal-AI2024图像,表7中呈现了前三项全面相似性审查,其中最相似的图像在图6中展示。结果显示,作者生成的数据集扭曲了原始标注,并产生了脊椎弯曲变化,这可以防止患者信息过度泄露。

picture.image

picture.image

VI Conclusion

作者提出了一种新颖的自生成框架,利用LRA参数化的脊柱表示来自动测量Cobb角。结合了LRA系数回归和锚框分类,通过稀疏和密集分配来检测脊柱段的不规则轮廓。

此外,还提出了一个数据引擎,该引擎包含半监督标注和隐私审查,最终形成了开源最大的脊柱侧弯X光数据集Spinal-AI2024。

广泛的实验已经证明了方法的有效性,在公共、私有和生成的数据集上,无论是最大Cobb角还是三个区域Cobb角,都实现了最先进的性能。

参考文献

[0]. SG-LRA: Self-Generating Automatic Scoliosis Cobb Angle Measurement with Low-Rank Approximation.

picture.image

扫码加入👉「集智书童」交流群

(备注: 方向+学校/公司+昵称 )

picture.image

点击下方“ 阅读原文 ”,

了解更多AI学习路上的 「武功秘籍」

0
0
0
0
关于作者
相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论