一句话解读
一
背景及现状问题
卒中,尤其是缺血性卒中,是全球范围内主要的致死原因之一。心房颤动(AF)是最常见的心律失常,也是缺血性卒中的重要风险因素。在AF患者中,血栓主要形成于左心房(LA),特别是左心耳(LAA)。传统评估工具(如CHA₂DS₂-VASc评分)主要依赖于临床和人口统计学因素,却忽视了左心房及左心耳的具体形态特征与内部血流动力学状态,这可能导致风险评估的偏差或不完整。尽管已有研究尝试通过计算流体动力学(CFD)等机理模型模拟LA血流,但这些研究多受限于样本量小、计算成本高,且很少将形态、血流与临床数据(如血液生物标志物)进行系统整合。此外,大多数机器学习方法采用监督学习,依赖于已标记的数据和人工特征工程,限制了其在探索潜在、未被标记的风险表型方面的应用。
1.1 风险评估的单一性:现有临床评分系统未整合LA/LAA的形态与血流信息。
1.2 数据整合不足:多数研究仅聚焦于某一类数据(如仅临床、仅形态或仅模拟血流),缺乏多维度信息的系统融合。
1.3 样本与计算限制:CFD模拟通常样本量小,难以进行稳健的统计推断。
1.4 方法学的局限:监督学习方法依赖标签,无法无监督地发现数据中自然存在的患者亚组(表型群)。
二
技术创新点
本研究提出并实现了一个基于数字孪生(Digital Twin)框架的多模态数据融合与无监督机器学习分析流程,核心创新点如下
2.1 多域数字孪生构建:整合了临床数据(人口统计学、并发症、血液生物标志物如BNP、肌酐、MPV/PC比值等)、LA/LAA形态学参数(如口部面积、容积、球形度、弯曲角度等)以及基于CFD模拟的血流动力学指数(如LAA内残余粒子数)。通过机理模型(CFD模拟)生成患者特异性的血流动力学指标,实现了从医学影像到血流模拟的闭环。
2.2 无监督多核学习(MKL)与聚类分析:采用无监督MKL算法,将不同域的特征通过多核映射到低维空间,无需依赖血栓形成的历史标签。结合K-means++聚类,自动识别出具有相似多模态特征的患者表型群(Phenogroups)。通过SHAP(SHapley Additive exPlanations)分析,可解释各特征对表型分层的贡献度。
2.3 系统化的特征工程与数据处理:对缺失数据采用随机森林插补(missForest)。通过特征选择与相关性分析,筛选出最具代表性的形态、血流与临床变量。支持多种数据域组合的分析策略,以评估各域对血栓风险分层的贡献。
2.4 可解释性与临床转化导向:通过多核回归将低维空间反向映射至原始特征,增强模型的可解释性。最终输出具有明确临床意义的患者表型群,并与血栓形成历史相关联。
三
方法
研究纳入130名拟行左心耳封堵术(LAAO)的非瓣膜性房颤患者,所有患者左心房结构严重病变,且具有高血栓栓塞风险。
3.1 数据采集与处理
临床数据:包括年龄、性别、BMI、AF类型、并发症(心衰、高血压、糖尿病等)、血液标志物(BNP、肌酐、MPV、血小板计数等)及CHA₂DS₂-VASc评分。
影像数据:通过CT扫描获取LA/LAA三维结构,经半自动分割(Slicer软件)生成几何模型。
血流模拟:基于ANSYS Fluent求解Navier-Stokes方程,假设血液为牛顿流体,设置统一的肺动脉入口压力与二尖瓣出口流速边界条件,模拟三个心动周期内的血流,并追踪LAA内残余粒子数作为血流淤滞的代理指标。
形态参数提取:自动计算口部面积、LA容积、LAA曲折度、LAA-LSPV对齐角等16项形态指标。
3.2 分析方法
特征选择与插补:剔除缺失率>40%的临床变量,使用missForest插补其余缺失值。
多核学习降维:采用MKL将不同域的特征通过高斯核映射到2维空间。
聚类分析:使用K-means++将患者分为3个表型群,通过轮廓系数确定最佳聚类数。
统计分析:比较各表型群在临床、形态、血流指标上的差异,使用非参数检验(Wilcoxon、Kruskal-Wallis)及卡方检验。
可解释性分析:训练随机森林分类器,结合SHAP分析识别关键特征。
四
结论
4.1 单变量分析:血栓历史组在口部面积、LAA多叶比例、LAA内残余粒子数上显著高于无血栓组(p<0.05)。仅血脂异常在临床变量中显示出显著关联。
4.2 表型群识别与特征
表型群2(n=30):70%有血栓史,具有最大的LA容积、口部面积、LAA曲折度、LAA-LSPV对齐度及最高的LAA残余粒子数;临床表现为最高的BNP、肌酐、MPV/PC比值,以及更多的非阵发性AF。
表型群0与1:血栓史比例较低(33%与40%),形态学上结构较小,BNP等生物标志物水平较低。
仅形态特征聚类:识别出的表型群在LAA淤滞(残余粒子数)上存在显著差异,口部面积是主要驱动因素。
形态+血流特征聚类:表型群在血栓历史上出现显著差异,高血栓组(64%)伴随更大的LA/LAA结构、更高的BNP水平。
4.3 形态+血流+临床特征聚类(核心分析)
特征重要性分析(SHAP):在聚类模型中,BNP、LA容积、口部面积是区分表型群的关键特征。在血栓预测监督模型中,LAA残余粒子数、LAA中心线长度、口部面积、BNP位列前四,凸显多域整合的价值。
模型稳健性与泛化能力:通过子集训练与自助法验证,聚类稳定性得分达0.86。内部验证显示训练集与验证集表型群特征趋势一致。
4.4 讨论与临床意义:本研究通过数字孪生框架,首次系统整合了临床、形态与血流模拟数据,成功识别出具有显著血栓风险差异的房颤患者表型群。高血栓风险表型群(表型群2)呈现出结构重塑(LA扩大、LAA复杂化)、血流淤滞加剧以及神经激素激活(BNP升高) 等多域异常,这与房颤持续状态、心房重构及血栓形成病理生理机制相符。
口部面积的双重角色:虽然大口部通常关联高血栓风险,但在重度重构心房中,其与LAA容积的比值可能反而降低,提示单纯尺寸评估可能不足,需结合容积与形态综合分析。
BNP的核心地位:作为心腔压力与重构的标志,BNP在区分高中低风险表型中起到关键作用,支持其作为血栓风险评估的重要生物标志物。
形态与血流的保护性特征:某些形态配置(如小口部、低LAA-LSPV对齐)即使在生物标志物提示高凝状态下,也可能通过改善血流冲刷而降低血栓风险。
五
展望
本框架可作为传统CHA₂DS₂-VASc评分的补充,提供更个性化的血栓风险评估。高血栓风险表型群的早期识别,可指导加强监测、优化抗凝策略或提前干预(如LAAO)。数字孪生模型可用于模拟不同治疗策略(如封堵器植入)对血流的影响,辅助手术规划。
局限性
1. 样本代表性:所有患者均为需行LAAO的重症房颤患者,结论推广至更广泛房颤人群需谨慎。
2. 边界条件统一化:CFD模拟未个体化设置血流边界条件(如肺动脉压力、二尖瓣流速),可能影响血流模拟的个体精度。
3. 数据缺失与插补:部分临床变量缺失率较高,插补可能引入偏差。
4. 计算成本:CFD模拟耗时,难以直接应用于大规模人群。
5. 缺乏外部验证:需在独立队列中验证表型群的稳健性与预测效能。
未来研究方向
1. 扩大样本与外部验证:纳入更多低中风险患者,建立多中心队列验证表型群。
2. 个体化边界条件:整合超声、心导管等个体血流动力学数据,提升模拟真实性。
3. 机理模型优化与验证:遵循V&V40等标准进行模型验证,进行敏感性分析评估模拟参数对结果的影响。
4. 开发简化预测模型:基于形态-血流关系,构建低计算成本的代理模型或血栓风险评分。
5. 纵向研究:结合随访数据,建立血栓事件预测模型,推动数字孪生向临床决策支持系统演进。
复蓝简介
上海复蓝医疗科技有限公司(Fulan Medical Technology),公司创始团队来自复旦大学。专注于利用先进的计算机建模仿真与人工智能技术,提供心脑血管疾病的辅助诊断、外科及介入手术的计算机模拟及分析、血管植介入器械安全性与有效性评价等解决方案。

