大数跨境

2区6.3分!甲基化组测序+靶向亚硫酸盐测序生信分析+机器学习:外周血单个核细胞DNA甲基化标志物DMC-16和DMR-13区分肺良性结节与早期肺癌

2区6.3分!甲基化组测序+靶向亚硫酸盐测序生信分析+机器学习:外周血单个核细胞DNA甲基化标志物DMC-16和DMR-13区分肺良性结节与早期肺癌 CNS生信新靶点挖掘
2026-05-28
1
导读:肺结节的良恶性鉴别及手术方式选择是临床难题。本研究利用外周血单个核细胞DNA甲基化作为宿主抗肿瘤免疫应答的替代标志物,通过全基因组甲基化测序发现52,812个差异甲基化位点和1,373个差异甲基化区域

图片

肺结节的良恶性鉴别及手术方式选择(亚肺叶切除 vs 肺叶切除)是临床难题。本研究利用外周血单个核细胞DNA甲基化作为宿主抗肿瘤免疫应答的替代标志物,通过Methylome-seq全基因组甲基化测序发现52,812个差异甲基化位点和1,373个差异甲基化区域,经靶向亚硫酸盐测序验证,最终锁定DMC-16(ASIC2基因启动子区)和DMR-13(SPATS2基因体区)两个稳健标志物。基于这两个甲基化特征联合29项血常规及5项肿瘤标志物,采用12种机器学习算法构建双模型:SurgMalig模型用于鉴别良性结节与需手术的恶性结节(AUC: 训练集0.926,测试集0.806);ResectGuide模型用于区分微浸润腺癌与早期浸润性腺癌以指导手术切除范围(AUC: 训练集0.862,测试集0.843)。SHAP分析显示DMC-16和DMR-13是模型最关键特征。本研究为肺结节的无创精准分型及手术决策提供了新型表观遗传工具。

今天给大家解读一篇4月发表在《Communications Medicine》上的题目为“Peripheral blood mononuclear cell DNA methylation signatures guide surgical decision-making in indeterminate pulmonary nodules.”的文章。本研究针对鉴别肺结节良恶性的临床难题,基于DNA甲基化在抗肿瘤免疫中的作用,探索了PBMCs中DNA甲基化模式的应用价值。通过发现队列的全基因组甲基化分析,鉴定出56个差异甲基化位点和区域,并利用靶向测序在训练和测试队列中验证了2个甲基化特征。进一步构建了两个机器学习模型:SurgMalig模型用于区分良性和需手术切除的恶性结节;ResectGuide模型用于将恶性结节细分为MIA和eIAC以规划手术。结果证实这些甲基化特征相比常规血液标志物具有更好的区分能力,两个模型在队列中均取得较高AUC值。结论指出PBMC甲基化特征可为不确定肺结节的手术分诊提供临床可操作的工具。请持续关注我们,每天为您解读最新见刊的文献!)想薅生信资料羊毛?直接在对话框回复 “资料”,免费领取干货大礼包!包括数据集、绘图代码、图表复现、思路总结、参考文献……0代码!鼠标点点点即可轻松完成5-10分生信SCI全文复现!

不想做实验,没数据,还想要快速发表文章,没问题的!公共数据库就是我们的数据宝藏!没思路不用担心,作为专业的生信团队,我们很乐意为你们效劳,提供研究路线设计和数据挖掘分析,扫码联系我们吧!

图片





图片
图片





图片

图片
图片
图片
图片

团队成员合影(位于上海陆家嘴中心,可随时预约参观)


                                    (向下滑动查看更多)

图片
图片




题目:《外周血单核细胞DNA甲基化特征有助于指导不确定肺结节的手术决策Peripheral blood mononuclear cell DNA methylation signatures guide surgical decision-making in indeterminate pulmonary nodules

发表期刊:Communications Medicine

影响因子:6.3

研究背景

区分恶性与良性肺结节仍然是一个重要的临床挑战。鉴于DNA甲基化在抗肿瘤免疫中的作用,研究者旨在探究外周血单核细胞(PBMCs)中的DNA甲基化模式是否可作为肺结节分类的无创生物标志物。



                            CNSknowall 平台 Pubmed+AI 快速提炼全文要点

                            图片



                            研究思路:

                              1. 对发现队列(包括良性肺结节BPN、微浸润性腺癌MIA、早期浸润性腺癌eIAC患者)的PBMCs进行全基因组DNA甲基化谱分析(Methylome-seq),通过差异分析鉴定出56个差异甲基化胞嘧啶(DMCs)和区域(DMRs)。
                              2. 从中选取2个甲基化特征,在训练队列和测试队列中使用靶向亚硫酸氢盐测序(TBS)进行验证。
                              3. 进一步开发两个机器学习模型,整合DNA甲基化特征和常规血液生物标志物:SurgMalig模型(手术恶性分类器,区分良性结节与需手术切除的恶性结节)和ResectGuide模型(切除指导分类器,将恶性结节细分为MIA和eIAC以指导手术规划)。


                              研究亮点:

                                  • 首次利用外周血单核细胞(PBMCs)的DNA甲基化特征作为肺结节分类的非侵入性生物标志物。
                                  • 开发了两个机器学习模型,分别用于判断结节是否需要手术切除(SurgMalig模型)以及指导手术切除范围(ResectGuide模型),将甲基化特征与常规血液指标结合,增强分类准确性。


                                  研究结果:

                                    • 验证的甲基化特征相较于传统血液生物标志物,对肺结节特性表现出显著区分能力。
                                    • SurgMalig模型在区分良性与恶性结节方面表现优异:训练队列AUC为0.926,测试队列AUC为0.806。
                                    • ResectGuide模型能有效分类MIA和eIAC亚型:训练队列AUC为0.862,测试队列AUC为0.843。


                                    研究总结:


                                    • 结论:PBMC甲基化特征为不确定肺结节的手术分诊提供了具有临床操作性的工具。
                                    • 讨论(基于内容推演):该研究通过无创的血液检测(PBMCs)实现了肺结节性质的精确分类和手术决策指导,弥补了传统血液标志物区分能力不足的缺陷。两个模型分别从“是否需手术”和“手术范围”两个层面提供决策支持,具有直接临床转化潜力。但研究未提及样本量、验证队列的多样性及与其他影像学方法的比较,未来需进一步扩大验证。





                                    结果译文:

                                    1.临床队列与参与者特征


                                    我们建立了三个特征明确的队列,以发现和验证用于肺结节无创分类的PBMC DNA甲基化生物标志物(图1)。10名受试者因提取后DNA不足被排除。因此,47个样本(12例BPN、15例MIA、20例eIAC)作为发现队列用于Methylome-seq检测,剩余100个样本(30例BPN、37例MIA、33例eIAC)作为训练队列用于TBS检测。此外,93个样本(24例BPN、34例MIA、35例eIAC)作为测试队列用于评估机器学习构建的模型性能。关键的是,每个队列内的三个诊断组在年龄、性别和吸烟史方面均匹配良好,最大限度地减少了潜在的混杂效应(补充表1-3)。在发现队列和训练队列中,各组间的结节大小分布也具有可比性。虽然在训练队列中,MIA和BPN之间的结节类型存在显著差异,但这反映了这些疾病实体固有的影像学谱系,并强调了改善现有影像学诊断工具的必要性。所有患者均接受了手术切除,从而获得了明确的组织病理学分类。这些队列中eIAC组的绝大多数患者为IA期患者,在临床上难以与MIA和BPN患者区分。

                                    2.全基因组甲基化谱揭示不同肺结节的PBMC甲基化景观


                                    研究设计和方法总结于图1。为了鉴定肺结节患者PBMC中特异的DNA甲基化生物标志物,我们对发现队列中的PBMC样本进行了Methylome-seq,该队列包括12例BPN患者、15例MIA患者和20例eIAC患者。所有检测到的CpG位点均经过测序深度过滤(深度≥5)以确保甲基化水平的准确性。经过过滤后,我们检测到每个样本平均约3,200,000个CpG位点(总计4,045,187个位点),每个样本的甲基化分布详见于补充表4。这些位点被预处理成一个统一的甲基化矩阵用于下游分析。虽然BPN、MIA和eIAC组之间CpG甲基化水平的密度分布相似,但与BPN和MIA组相比,eIAC组的平均全局PBMC甲基化水平有统计学显著增加(补充图1)。


                                    3.通过Methylome-seq鉴定肺结节亚型特异性的DMC和DMR


                                    DMC被定义为满足以下所有标准的CpG位点:(i)两两比较q<0.05,(ii)组间甲基化差异≥10%,以及(iii)变异系数≥0.7。火山图和热图显示,在MIA vs BPN、MIA vs eIAC和BPN vs eIAC的比较中,分别有52,812、77,759和48,058个DMC(图2A-D;补充图2A-B)。基于这些DMC的主成分分析显示MIA与BPN和eIAC均能明显分离,突显了与MIA相关的独特PBMC甲基化特征(图2E)。基因组分布分析显示DMC主要定位于基因体,而调控区域包含的位点较少(图2F-H)。DMC修饰基因的KEGG通路分析显示,它们在发育和信号转导关键通路中显著富集,包括神经活性配体-受体相互作用、cAMP信号传导和激素调节(图2I-J;补充图2C)。
                                    DMR被定义为在组间显示一致甲基化差异的连续基因组片段,与单个位点的DMC相比,具有更强的统计功效和生物学可解释性。我们将基因组划分为50bp的窗口,并在各组之间进行两两比较,将满足以下所有标准的窗口指定为DMR:(i)两两比较q<0.05,(ii)组间甲基化差异≥10%,以及(iii)CV≥0.7。火山图和热图鉴定出MIA vs BPN比较中的1,373个DMR、MIA vs eIAC比较中的2,514个DMR以及BPN vs eIAC比较中的1,090个DMR(图3A-D;补充图3A-B)。使用DMR谱的PCA也有效地将MIA组与BPN和eIAC组区分开来(图3E)。DMR同样富集于基因体中,并通过KEGG分析涉及类似的发育通路(图3F-I;补充图3C)。
                                    鉴于候选DMC数量庞大,我们将显著性阈值收紧至两两比较中q<0.001。随后,我们鉴定出在所有两两比较(MIA vs BPN、MIA vs eIAC、BPN vs eIAC)中共有的21个DMC,这些DMC共同区分了三个组(图4A)。热图显示了这些DMC的不同甲基化模式,表明它们在MIA组、BPN组和eIAC组中均存在显著差异(图4B;补充表5)。类似地,共有35个DMR在所有两两比较中区分了三个组,热图可视化了它们组特异性的甲基化谱(图4C-D;补充表6)。

                                    4.通过TBS对鉴别性甲基化生物标志物进行稳健验证


                                    TBS是一种基于PCR的深度测序方法,用于精确的DNA甲基化定量,我们采用它来验证差异甲基化(图5A)。成功为21个DMC中的20个和35个DMR中的29个设计了亚硫酸盐测序引物,并随后用于训练队列的TBS分析(补充表7)。结果显示,在MIA vs eIAC组中,8个DMC和4个DMR存在显著差异;在MIA vs BPN组中,5个DMC和7个DMR存在显著差异;在BPN vs eIAC组中,4个DMC和5个DMR存在显著差异(图5B)。至关重要的是,只有两个特征——DMC-16和DMR-13——在所有三个两两比较中均显示出统计学显著的差异甲基化(图5B)。发现队列中的Methylome-seq结果和训练队列中的TBS结果均表明,DMC-16和DMR-13在三组之间存在显著差异(图5C-F)。此外,我们使用TBS在测试队列中检测DMC-16和DMR-13,得到了一致的结果(图5G-H)。此外,ROC曲线结果显示,DMC-16、DMR-13及其组合评分能够区分不需要手术切除的BPN患者与需要手术切除的MIA和eIAC患者,而传统的血清肿瘤标志物则无此能力(图5I-J;补充图4A-B)。此外,ROC曲线结果显示,DMC-16、DMR-13及其组合评分也能在一定程度上区分仅需亚肺叶切除的MIA患者与需行肺叶切除的eIAC患者,同样传统血清肿瘤标志物不具备这种区分能力(图5K-L;补充图4C-D)。这些ROC曲线的相关指标见补充表8-9。

                                    5.基于PBMC甲基化特征的机器学习手术恶性肿瘤分类模型和切除指导分类模型的构建


                                    然而,仅甲基化特征对肺结节的判别能力需要进一步提高。鉴于免疫系统甲基化不仅反映甲基化状态,还反映循环免疫细胞组成的动态变化,我们使用113个机器学习模型,将已鉴定的甲基化特征与29项常规血液学参数和5项肿瘤血液生物标志物整合。
                                    首先,我们开发了SurgMalig模型作为手术恶性肿瘤分类器,用于区分需要手术的恶性结节(MIA和eIAC)与BPN(图6)。热图显示,Lasso+Stepglm[forward]算法获得了最佳的AUC性能,被确定为最适合SurgMalig模型的算法(图6A)。该模型在区分良性与恶性结节方面表现出高性能,在训练队列中AUC为0.926,在测试队列中AUC为0.806,PRAUC分别为0.970和0.933(图6B)。使用混淆矩阵进一步严格评估模型性能,训练队列的总体准确率达到0.860,测试队列为0.742(图6C-D)。SurgMalig模型的精确度分别为0.952和0.925,表明大多数预测为阳性的病例被正确分类(补充表10)。SurgMalig模型包含9个特征:Basophil、CA19-9、Cyfra21-1、DMC-16、DMR-13、MCH、MCHC、PLT和Smoking History。在单个特征中,DMC-16和DMR-13在训练队列和测试队列中作为独立特征使用时,其性能优于其他特征(图6E-F;补充图5A-B)。采用SHAP值条形图量化和可视化每个特征对SurgMalig模型预测的贡献(图6G)。SHAP值反映了在不同特征组合下每个特征影响最终预测的程度。DMC-16和DMR-13的高SHAP值表明这些特征对模型的预测有实质性影响(补充图5C-G)。蜂群图展示了每个特征SHAP值的分布,直观地显示了每个特征的不同数值范围如何影响模型输出(图6H)。在所有特征中,DMC-16和DMR-13表现出最高的影响,更高的特征值对应更高的SHAP值,表明DMC-16和DMR-13水平升高显著增强了模型对恶性的预测倾向。
                                    随后,我们构建了ResectGuide模型作为切除指导分类器,进一步将恶性结节细分为MIA和eIAC,从而辅助手术决策(图7)。热图显示Enet[alpha=0.2]算法取得了最佳的AUC性能,确认了其适用于ResectGuide模型(图7A)。该模型在区分MIA和eIAC方面表现出强劲性能,训练队列的AUC为0.862,测试队列为0.843,PRAUC分别为0.881和0.962(图7B)。通过混淆矩阵评估显示,训练队列的总体准确率为0.814,测试队列为0.783(图7C-D)。ResectGuide模型的精确度分别为0.955和0.917,意味着大多数被预测为阳性的标签是准确的(补充表10)。ResectGuide模型包含11个特征:DMC-16、DMR-13、Diameter、Monocyte、Monocyte Percentage、CEA、PDW、Basophil、RDW-CV、Eosinophil Percentage和PLT。当单独评估时,这些特征在预测亚分类方面表现出相当的性能(图7E-F;补充图6A-B)。SHAP分析显示,DMC-16始终具有较高的SHAP值,强调了其在ResectGuide模型预测中的突出作用(图7G-H;补充图6C-G)。

                                    更多结果和补充图表:doi:10.1038/s43856-026-01616-4



                                    图片



                                     长按二维码关注我们,用最短的时间和最高的效率学习更多生信思路!
                                    图片

                                    扫描上方二维码或登录平台官网后添加CNSknowall客服微信咨询!官网地址:https://cnsknowall.com

                                    CNSknowall:24年最新问世的遥遥领先的颠覆性科研数据(0代码生信+统计学)分析平台,同时含有机制图模块(原创3000多素材和机制图模板)+AI一键生成高质量比国自然标书初稿+汉化版Pubmed融合Deepseek高效筛选目标文献同时一键提炼全文核心创新点+SCI文献例句/语料检索模块+全文翻译+文献求助+图片查重+期刊查询+OPenAI官方GPT接口,>500款CNS级别图表皆可一秒内一键出图,登录即秒变数据分析大神,体验前所未有的便捷数据分析之旅,开启科研天骄之路!

                                    可向下滑动发掘更多科研秘籍!

                                    图片

                                    图片图片


                                    图片


                                    图片

                                    图片

                                    图片

                                    图片


                                    图片

                                    图片

                                    图片





                                    【声明】内容源于网络
                                    0
                                    0
                                    CNS生信新靶点挖掘
                                    每日汇总固定几本期刊上月最新见刊的生信类研究SCI!
                                    内容 0
                                    粉丝 0
                                    CNS生信新靶点挖掘 每日汇总固定几本期刊上月最新见刊的生信类研究SCI!
                                    总阅读0
                                    粉丝0
                                    内容0