大数跨境
0
0

Biomarker Research(二区 IF=11.5)| 基于机器学习的放射组学模型:子宫内膜癌患者的预后预测与机制探索

Biomarker Research(二区 IF=11.5)| 基于机器学习的放射组学模型:子宫内膜癌患者的预后预测与机制探索 瓴智医学AI
2025-10-14
1
导读:研究针对子宫内膜癌患者预后预测准确性不足的临床挑战,提出了一种基于机器学习的放射组学模型,通过整合肿瘤和瘤周区域的T2WI三维纹理特征,结合十种机器学习方法优化放射组学评分,并探索其生物学机制。
本文题为《Machine learning-based radiomics model: prognostic prediction and mechanism exploration in patients with endometrial cancer》,由Yu Zhang等共同完成,作者单位包括安徽医科大学第一附属医院放射治疗科、宾夕法尼亚大学佩雷尔曼医学院外科、浙江大学第二医院肝胆胰外科等。该研究针对子宫内膜癌患者预后预测准确性不足的临床挑战,提出了一种基于机器学习的放射组学模型,通过整合肿瘤和瘤周区域的T2WI三维纹理特征,结合十种机器学习方法优化放射组学评分,并探索其生物学机制。研究结果显示,基于XGboost的组合模型在多个独立队列中表现出卓越的预测性能,对1年、3年和5年总生存期的AUC在验证集和测试集中均超过0.85,最高达0.916;该模型不仅对现有临床指标(如FIGO分期)具有显著增量价值,还能与病理组学、转录组学和蛋白质组学协同,进一步提升预后预测的准确性与稳定性。机制研究表明,放射组学模型与肿瘤血管生成相关通路密切相关,其中FLT1基因被确认为关键分子,并通过前瞻性影像参数(IVIM-DWI和DCE-MRI)及体外功能实验验证了其在促进血管生成中的作用。

01 摘要

本研究旨在开发基于机器学习的放射组学模型,以预测子宫内膜癌患者的术后总生存期并探索其生物学机制。
研究团队回顾性及前瞻性纳入了多中心共602例患者,通过提取肿瘤及瘤周区域的放射组学特征,并应用XGboost等机器学习算法构建预测模型。
结果显示,该模型展现出优异的预测性能,且对临床指标、病理组学等多组学数据具有显著的增量价值。机制研究表明,该模型与肿瘤血管生成密切相关,尤其与FLT1基因表达显著相关,为无创评估肿瘤生物学行为提供了新依据。

02 研究背景

本研究基于子宫内膜癌全球发病率逐年上升的临床背景,尽管早期患者术后五年生存率可达70%-90%,但中晚期及复发患者该指标骤降至约30%。当前预后评估主要依赖FIGO分期等临床病理特征,其预测精度仅约60%-70%,难以满足个体化治疗需求。肿瘤异质性和微环境差异导致患者对相同治疗方案的反应存在显著差异,因此亟需开发更精准的预后预测工具。
放射组学作为一种非侵入性、可重复的高通量图像分析技术,能够从医学影像中提取反映肿瘤生物学行为的定量特征,结合机器学习算法可优化模型性能。本研究旨在整合多中心影像与多组学数据,探索放射组学在EC预后预测中的价值及其潜在分子机制。

03 模型设计

本研究构建并验证了一个用于预测子宫内膜癌患者术后总生存期的综合模型。研究团队从三个临床中心及公共数据库共纳入602例患者,并将其系统划分为训练集、前瞻性测试集、回顾性验证集及外部测试集,以确保模型的稳健性与泛化能力。核心流程包括基于多中心MRI图像构建放射组学模型,并将其与临床指标相结合形成联合预测模型。
该模型在多个独立数据集上进行了严格的放射组学性能验证和综合预测效能验证。同时,研究利用TCGA、CPTAC等公共数据库构建多组学模型,深入探索了与预后相关的潜在生物学机制,从而实现了从影像特征到分子通路的关联阐释。

04 实验设置

本研究采用多中心回顾性与前瞻性相结合的队列设计,系统性地构建并验证了基于机器学习的放射组学预测模型。
研究首先纳入469例回顾性数据进行模型开发,并前瞻性收集90例患者及公共数据库样本进行外部验证。通过两位放射科医生独立勾画T2WI序列中肿瘤及瘤周5mm区域的三维感兴趣体积,使用PyRadiomics提取高稳健性特征;采用十种机器学习算法筛选最优放射组学评分;通过多变量Cox回归分析明确放射组学相对于FIGO分期等临床指标的增量价值;进一步整合病理组学、转录组学和蛋白质组学数据构建多组学联合模型。
机制探索阶段,研究通过差异表达分析筛选与放射组学评分相关的枢纽基因,最后通过细胞实验对关键基因FLT1进行功能验证。

05 结果与分析

(1)不同机器学习模型比较
通过复合AUC值系统比较了10种机器学习算法在多个数据集上的预测性能。结果显示,基于XGboost的肿瘤-瘤周联合模型在验证集和测试集中均表现最优,显著优于其他单一模型。特别值得注意的是,肿瘤区域与瘤周区域的放射组学特征呈现明显互补性,联合模型较单一肿瘤模型预测效能提升约5-8%。图中D-J子图进一步展示联合模型在训练集、验证集和测试集中1-5年生存预测的ROC曲线,证明其具有稳定的时间泛化能力。最终确立了XGboost作为最佳建模算法的基础。
(2)放射组学模型的临床增量价值
此图通过列线图(A)和森林图(B)展示放射组学评分与临床指标的整合效果。多因素Cox回归确认Radscore、FIGO分期和分化程度为独立预后因素。校准曲线(C)显示预测概率与实际观察值高度一致,决策曲线(D)证实联合模型在阈值概率0.2-0.8范围内具有最大临床净获益。临床影响曲线(E)进一步表明模型可准确区分高风险人群。综合来看,Radscore的加入使模型AUC提升至0.884-0.992(F-H),NRI/IDI分析显示重分类改善度达25-30%,证明放射组学对传统临床指标具有显著增量价值。
(3)生物学机制验证
通过多组学联用揭示放射组评分的生物学基础。
A-C图:转录组与蛋白质组交集分析识别307个差异基因,功能富集于血管生成和缺氧应答通路。
D图:Cytoscape筛选出FLT1等10个枢纽基因,其与Radscore显著相关。
F图:单细胞分析显示FLT1主要表达于内皮细胞和肿瘤细胞。
图7通过功能影像和实验验证证实机制:IVIM-DWI参数f值和DCE-MRI参数Ktrans与Radscore高度相关,且与FLT1表达一致。免疫荧光(D)显示高Radscore组FLT1/CD31表达显著上调,血管生成实验(F)证明FLT1敲降可抑制血管形成,完整阐释"影像特征-功能参数-基因表达-生物学行为"的因果链条。

06 结论

本研究成功构建了基于机器学习的放射组学模型,用于预测子宫内膜癌患者的术后生存期。研究团队通过多中心数据验证了模型的优异性能,其预测AUC最高达0.992。该模型不仅对临床指标具有显著增量价值,还能与多组学数据有效互补。机制研究揭示,模型的预测能力与肿瘤血管生成密切相关,关键基因FLT1的表达水平是重要生物学基础。

07 论文评价

方法创新亮点

    构建了多中心、多组学融合的放射组学预测模型,并深入探索其生物学机制。通过十种机器学习算法筛选最优模型,并且研究突破了传统影像学分析的局限,整合临床指标、病理组学、转录组学和蛋白质组学数据,证实放射组学与多组学数据的协同互补价值。

    方法不足

    肿瘤区域的勾画依赖人工操作,虽经两位放射科医生独立完成,但主观性仍可能影响特征提取的重复性,并且多组学分析部分样本量有限,CPTAC队列仅35例,且缺乏外部临床队列验证,模型泛化能力需进一步扩大样本验证。

    08 参考资料

    论文链接:

    https://doi.org/10.1186/s40364-025-00836-5


    图文:陈浩翔
    编辑:植洁莹
    审核:吴朝

    The Lancet Digital Health(一区,IF=24.1)中国CT血管造影图像颅内动脉瘤检测的深度学习模型

    PAIN(一区IF=5.5)使用多模态神经影像学和自主神经指标对临床疼痛进行基于机器学习的预测

    Nature Communications,(一区,IF=15.7)多模态深度学习在阿尔茨海默病痴呆评估中的应用

    Cell Reports (一区|IF=6.9)深度学习整合全基因组关联研究与多组学数据以识别阿尔茨海默病的病理机制及药物重定位

    npj digital medicine(一区 IF=15.1)| 多模式GPT模型辅助甲状腺结节诊断与治疗

    【声明】内容源于网络
    0
    0
    瓴智医学AI
    分享医学人工智能前沿知识,搭建跨学科研究、合作及应用转化平台。致力于医学人工智能技术、研发及科研,提供医学人工智能全方位服务。
    内容 68
    粉丝 0
    瓴智医学AI 分享医学人工智能前沿知识,搭建跨学科研究、合作及应用转化平台。致力于医学人工智能技术、研发及科研,提供医学人工智能全方位服务。
    总阅读38
    粉丝0
    内容68