大数跨境
0
0

浙江大学医学院力作!IF15.1 + 中科院一区 TOP,4 图 1 表搞定高分 SCI!

浙江大学医学院力作!IF15.1 + 中科院一区 TOP,4 图 1 表搞定高分 SCI! 生信数析
2025-12-01
1
导读:创新选题 方案评估 专属定制点击蓝字关注我吧引言无症状却增病风险的G2SCH,因常规体检缺专项检测而隐匿发病,

创新选题 

方案评估 专属定制


点击蓝字关注我吧


引言

无症状却增病风险的G2SCH,因常规体检缺专项检测而隐匿发病,现有模型难落地。浙江大学医学院用超9万例体检数据,建出AUC0.870、敏感度86.8%的机器学习模型,凭常规体检指标即可早期筛查,补全低成本筛查工具空白。

(想靠GBD、CHARLS、NHANES数据库解锁生信分析?关注后后台戳我们!专业数析支持,让科研之路少走弯路~)

文献解读



中 文 题 目:通过对体格检查指标的机器学习分析,早期发现G2SCH

发 表 期 刊 :Npj Digital Medicine

发 表 时 间 :2025年11月12日

影 响 因 子 IF=15.1

是不是数据挖掘耗了太多时 间,进展却缓慢?


别焦虑,生信数析陪你一步步搞定,轻松拿下SCI!

生信数析

专注生信分析:GBD/NHANES/CHARLS/MR


研究背景

G2SCH无症状却增病风险,常规体检漏诊多、血清检测难普及;体检数据机器学习已有应用,但缺G2SCH低成本筛查模型。

研究方法

浙江大学医学院取两机构超9万体检样本,以3种特征选择法+5种机器学习算法构建模型,选LASSO特征、65:35 SMOTENC逻辑回归模型,用SHAP解析特征,以AUC、敏感度、特异性评估性能。

图1 实验背景,设计与样本筛选


研究结果



特征分析

2019-2020 年浙大二院解放路院区收集 57,539 份体检记录,其中 92 份为 G2SCH 型,其与非 G2SCH 个体特征详见表 1。

表1 非G2SCH和G2SCH特征统计

G2SCH 组较非 G2SCH 组年龄更高(p<0.001)、女性比例更高(p=0.015)、SBP、AST、肌酐显著升高(p 均 < 0.05),白蛋白、血红蛋白、红细胞计数显著降低(p 均 < 0.05),桥本甲状腺炎患病率更高(p<0.05);两组 BMI、DBP、血脂等指标无显著差异,总体女性年龄低于男性。

图 2 呈现非 G2SCH 与 G2SCH 组关键特征差异及性别分层年龄分布

 多种机器学习方法在预测G2SCH表现的比较

单变量分析、LASSO、mRMR 三种方法分别筛选出 AGE、超声、GLU 等特征,采用不同 SMOTENC 比率,通过 AUC、灵敏度等指标比较 LR、RF 等五种机器学习方法性能,选出各方法最佳模型并绘制 ROC 曲线。

图 3 比较不同特征选择方法下机器学习模型的性能


3 特征重要性排名

SHAP 分析揭示模型中 G2SCH 的预测变量影响,图 4 显示超声、AGE、红细胞为核心预测因子,白蛋白等亦具显著预测价值。

图4 展示顶级模型中影响 G2SCH 预后的核心变量及作用

文章小结

本研究构建的G2SCH预测模型,以65:35 SMOTENC比例+LASSO特征的逻辑回归表现最优(AUC 0.870),关键特征为超声结果、年龄、红细胞,且简化模型适配资源不足地区;模型可灵活匹配不同医疗场景需求,助力G2SCH早筛与高危人群管理。

(瞄准高分、想复刻顶刊思路的友友看过来!联系生信数析,让科研之路少走弯路,解锁无限潜力~)

长按识别二维码 

专属生信分析方案一对一定制~

【声明】内容源于网络
0
0
生信数析
欢迎来到生信数析,小编主要做提供思路、选题设计方案评估、数据挖掘纯生信分析!专注于GBD、NHANES、CHARLS等数据库深入分析研究,可结合MR(孟德尔随机化)、SHAP(机器学习)等方法,为发表高分SCI助力。
内容 13
粉丝 0
生信数析 欢迎来到生信数析,小编主要做提供思路、选题设计方案评估、数据挖掘纯生信分析!专注于GBD、NHANES、CHARLS等数据库深入分析研究,可结合MR(孟德尔随机化)、SHAP(机器学习)等方法,为发表高分SCI助力。
总阅读1
粉丝0
内容13