大数跨境
0
0

ScreenLungNet:基于单次LDCT筛查的个体化长期肺癌风险预测模型

ScreenLungNet:基于单次LDCT筛查的个体化长期肺癌风险预测模型 汇智灵曦
2025-11-25
4
导读:本文介绍了基于低剂量CT(LDCT)中多结节特征与全肺全局特征开发的ScreenLungNet模型。该模型经过多次验证,表现优于仅基于结节特征的传统模型,且首次实现对筛查阴性人群的有效风险评估,为优化




引言




这是一篇2025年10月发表于《Radiology》的最新研究,该研究基于低剂量CT(LDCT)中多结节特征与全肺全局特征,开发了ScreenLungNet模型,实现3年肺癌风险的个性化预测。该模型在国内外多个独立队列中进行验证,表现优于仅基于结节特征的传统模型,且首次实现对筛查阴性人群的有效风险评估,为优化肺癌筛查策略提供了新工具。


Paper:https://www.sciencedirect.com/science/article/pii/S2666379125002058?via%3Dihub


Code:https://github.com/zhjtwx/ScreenLungNet






研究背景




肺癌是全球癌症相关死亡的主要原因,早期诊断的困难导致晚期患者比例高,全球5年生存率仅为10-20%。美国的国家肺癌筛查试验(NLST)和欧洲的荷兰-比利时肺癌筛查试验(NELSON),均证明LDCT筛查能够显著将高危人群的肺癌死亡率降低20-24%。对于肺癌筛查,年龄和吸烟史是目前用来确定高危个体的主要因素,结节特征(密度、大小和生长等)主要被认为是指导治疗。然而这种模式面临几个严重的临床问题:首先是阳性预测值(PPV)偏低,NLST的基线PPV仅为3.8%,导致过度诊断和不必要的有创检查;其次,这种模式仅依赖结节特征预测长期风险,忽略了全局肺部的病理生理状态。




研究内容




针对上述背景,该研究旨在调查全局肺部特征对长期肺癌风险评估的预测价值。通过开发四个模型(单结节、多结节、全局肺、融合特征)来预测长期风险,以评估不同特征的贡献。


1

模型架构




开发了一种基于CT图像的肺癌筛查模型,命名为ScreenLungNet。ScreenLungNet包含四个主要组成部分:结节检测与肺部分割、肺部全局特征提取、结节局部特征提取以及融合与预测。


1.结节检测与肺部分割


使用辅助软件,对每张CT图像进行处理,以准确检测所有肺结节,通过识别每个结节并标注其对应的肺叶位置。此外,通过分割肺部掩膜生成肺部区域。随后,所有检测到的肺结节将被输入到恶性肿瘤分类模块,用于获取每个结节的恶性评分。单结节模型根据肺部恶性评分最高的结节构建,以预测肺癌。


2.结节的局部特征提取


根据每个结节的恶性评分及其位置,为每个肺叶构建一个四维向量。该向量包含结节数量、最大恶性评分、最小恶性评分以及该肺叶内所有结节的平均恶性评分。如果在某一肺叶中未检测到结节,则该向量中的所有值均设为零。最终得到五个这样的四维向量,每个肺叶对应一个。这些向量随后通过FC层以提取结节的局部特征。多结节模型综合了每个肺叶内所有检测到的结节的特征,以预测肺癌。


3.肺部全局特征提取


利用第一步获得的肺部区域,通过ViT模型提取肺部的全局特征。具体而言,将肺部区域尺寸调整为64×64×64,然后将调整后的体积分割为512个大小为8×8×8的图像patch。每个图像patch经过展平后的线性投影,生成一个64维的图像patch token。随后通过12个Transformer模块处理,输出为一组包含512个图像patch特征的结果。这些特征被拼接后输入FC层,以获得肺部的全局特征


4.融合与预测


最后,ScreenLongNet融合了局部结节特征和全局肺特征,将进行拼接。该融合后的特征向量随后通过FC层进行进一步的特征整合。最终得到的融合特征同时包含了全局肺部特征和局部结节特征,并作为二分类器的输入,用于预测个体患肺癌的风险。



2

数据来源




该回顾性研究使用了来自温岭市筛查队列、浙江省肿瘤医院和NLST数据库的数据。


其中,使用3年随访数据的温岭队列(2019–2021)用于模型的训练集1、验证集、内部测试集,并提取一个癌症富集子集评估模型在最大结节大小情况下的性能,迄今为止只有2年随访数据的温岭队列作为独立内部测试集;浙江省肿瘤医院队列(2017–2023)经过一系列排除,为了平衡良恶性数据,用于模型的训练集2;NLST队列作为外部测试集,并提取基线阴性子集评估模型在无显著异常人群中的表现。



3

模型训练




为了更好地监督每个网络组件的训练过程,训练过程中采用了三种损失函数: 和,分别对应全局特征、局部特征和融合特征。最终的损失函数定义为,用于优化整个模型的参数。所有损失函数均采用CE loss形式实现。模型使用 PyTorch 深度学习框架进行训练,并采用Adam优化器。训练过程共进行800 epoch,初始LR为 0.0001,在第400 epoch和第600 epoch时LR分别降低为原来的十分之一。每50轮保存一次模型参数,并在验证集上评估模型性能。选择在验证集上AUC最高的模型,在测试集上进行测试。


模型性能通过AUC、混淆矩阵、诊断指标(AUC、准确率、特异性、敏感性、阳性预测值PPV、阴性预测值NPV)及95%置信区间进行评估。




实验结果




1

模型性能




下图和表分别展示了构建的四个模型在所有测试集中预测长期肺癌的雷达图和详细指标。与其他三个模型相比,ScreenLongNet在所有测试集中的所有指标上都表现出了优越的性能。




ScreenLungNet对主要队列中每位参与者生成的预测概率如下图所示。图中绿线代表健康人群的风险分数分布,红线代表癌症患者的风险分数分布。一个好的模型应该能让这两条线尽可能地分开。图中显示,ScreenLungNet的预测结果下,绝大多数健康人群集中在低分段,而癌症患者则更多地分布在高分段,两者的重叠区域很小,证明了其优异的区分能力。 虚线表示选定的筛查阈值。



此外,实验还评估了ScreenLungNet在预测1年和3年内肺癌发生率方面的性能,模型的ROC-AUC曲线图如下图所示:



在基线阴性筛查子集中,ScreenLongNet再次优于其他模型,如下表所示:



2

可解释性




临床应用示例要通过视觉检查评估ScreenLungNet对肺癌风险评估的影响,为凸显模型预测长期肺癌风险的能力,本研究分析了若干基线影像。图示两个案例分别涵盖无结节与存在结节两种情况,案例1(A-D)是一位基线CT未见明确结节的患者,但ScreenLungNet给出了0.77的高风险评分,其热力图精准地高亮了后续发生癌变的左下肺区域,说明模型捕捉到了肉眼不可见的异常信号。案例2(E-G)是一个7.5mm的小结节,Lung-RADS分类为3类(建议短期随访),但ScreenLungNet给出了0.98的极高风险评分,热力图不仅聚焦于结节本身,还关注了其周围的肺实质特征,最终该结节在5个月后证实为恶性。这些案例生动地说明了模型是如何工作的,及其超越传统随访策略并实现精准风险评估的能力。





结论




这项研究提出了一种融合多结节信息与全局肺部特征的深度学习模型,在仅基于单次LDCT影像进行长期肺癌风险预测方面,其性能显著优于仅依赖结节信息的传统模型,尤其是在识别筛查阴性人群的潜在风险方面。






训练推理一体化平台服务内容




汇智灵曦推出的训练推理一体化平台,集成了多种经典AI模型,内置AI模型商城,为用户提供高效便捷的训练与推理解决方案。用户只需设置输入输出路径并调整参数,即可快速完成模型训练与推理,无论是科研探索还是临床应用,都能轻松上手。平台具备简洁的界面和操作流程,免去复杂的技术要求,帮助用户节省时间、提高效率,是实现AI技术快速落地的理想选择。



点击下方“阅读原文”

立即申请“训练推理一体化平台”试用

【声明】内容源于网络
0
0
汇智灵曦
汇智灵曦数字科技以“智赋医疗,研以致用”为理念,致力于通过AI技术推动医疗健康数字化转型。公司聚焦医疗场景需求,打造了包含深度问数、汇智查房等医疗AI产品,为医疗机构提供从临床决策到科研创新的全链条解决方案,大幅提升诊疗质量与科研效率。
内容 31
粉丝 0
汇智灵曦 汇智灵曦数字科技以“智赋医疗,研以致用”为理念,致力于通过AI技术推动医疗健康数字化转型。公司聚焦医疗场景需求,打造了包含深度问数、汇智查房等医疗AI产品,为医疗机构提供从临床决策到科研创新的全链条解决方案,大幅提升诊疗质量与科研效率。
总阅读22
粉丝0
内容31