大数跨境
0
0

Nature Medicine(一区IF=50.0) | 人工智能引导的新生儿重症监护室精准肠外营养

Nature Medicine(一区IF=50.0) | 人工智能引导的新生儿重症监护室精准肠外营养 瓴智医学AI
2025-08-02
0
导读:研究针对新生儿重症监护室中TPN方案制定存在的主观性强、错误率高和资源消耗大等问题,提出了一种基于人工智能的精准营养系统——TPN2.0。
本文题为《AI-guided precision parenteral nutrition for neonatal intensive care units》,由Thanaphong Phongpreecha、Marc Ghanem、Jonathan D. Reiss等来自斯坦福大学医学院、加州大学旧金山分校(UCSF)及露西尔·帕卡德儿童医院的研究团队共同完成,作者单位涵盖麻醉与围手术期医学系、儿科系、生物医学数据科学系等多个研究机构。该研究针对新生儿重症监护室(NICU)中全肠外营养(TPN)方案制定存在的主观性强、错误率高和资源消耗大等问题,提出了一种基于人工智能的精准营养系统——TPN2.0。该系统通过变分神经网络(VNN)和半监督聚类算法,将复杂的个体化营养需求标准化为15种核心配方,并结合物理约束Transformer实现动态调整和医工协作决策。在斯坦福(79,790份处方)和UCSF(63,273份处方)的双中心验证中,TPN2.0与专家处方的相关性达到Pearson's R=0.94,医生盲法评估得分(56分)显著优于现行方案(35分,p<0.0001)。更重要的是,偏离AI推荐的TPN方案与死亡率上升5倍、坏死性小肠结肠炎风险增加3.3倍等严重不良结局显著相关。研究表明,TPN2.0不仅将传统4-12小时的营养方案制定流程缩短至10分钟,还能在资源有限的环境中推广使用,为新生儿重症营养管理提供了高效、安全的精准医疗解决方案,推动了AI从临床预测向治疗决策支持的范式转变。

01 摘要

本研究开发了AI驱动的精准肠外营养系统TPN2.0,用于优化新生儿重症监护室(NICU)的营养管理。通过分析斯坦福医院79,790份TPN处方(5,913名患者)并利用变分神经网络与半监督聚类,系统生成15种标准化营养配方(与专家决策相关性达Pearson's R=0.94)。在UCSF医院63,273份处方(3,417名患者)的外部验证中保持高相关性(R=0.91)。盲法研究(n=192)表明医生对TPN2.0的认可度显著高于现行方案(评分56 vs. 35, P<0.0001)。关键发现显示:偏离TPN2.0的处方与不良结局风险上升相关(如坏死性小肠结肠炎OR=3.33, P=0.0007),而遵循推荐可降低死亡率(5倍)和胆汁淤积症(2倍)风险。基于Transformer的物理约束模型实现了临床指南兼容的医工协作决策,流程耗时从传统4-12小时缩短至10分钟。该系统通过平衡个性化与标准化,为资源有限环境提供了可推广的解决方案。

02 研究背景

新生儿重症监护室(NICU)承担约10%美国新生儿的救治任务,且早产儿比例持续上升。尽管NICU技术历经机械通气(1970s)、表面活性物质替代疗法(1980s)等革新,当前AI在临床干预中的应用仍严重不足——仅10%的美国医院采用AI,且新生儿科渗透率为0%。全肠外营养(TPN)作为早产儿和胃肠功能不全患儿的生命线,面临三重挑战:
1.标准化缺失:地域实践差异大(如欧美蛋白质用量冲突),缺乏统一指南;
2.执行复杂性:依赖多学科协作,处方错误率高(占NICU高危用药错误首位);
3.临床风险:不当TPN与坏死性小肠结肠炎(NEC)、败血症等严重并发症显著相关。
现有TPN计算工具仅解决理化兼容性问题,无法优化个体化营养决策。AI驱动的精准营养方案亟待开发,尤其对资源有限地区(如中低收入国家)具有重大意义。

03 模型设计

1.概述
TPN2.0 旨在通过利用 ML(1)制定一套标准化的 TPN 配方,然后(2)根据患者的临床特征从这些标准化配方中推荐最适合的配方,从而减少配方主观性并提高 TPN 处方过程的复合效率(Fig1a)。
a:当前的 TPN 订购工作流程涉及一个多学科团队合作,为每位患者确定适当的每日 TPN 组成。TPN2.0 旨在简化作,以减少成本、错误和实践可变性。
TPN2.0的开发基于斯坦福大学十余年积累的数据。在这十年间,患者接受TPN治疗的平均时长为14±23天,中位数为7天,反映出病例间的高度差异性——例如,90%的患者治疗周期在50天以内(Fig1b),TPN各成分随时间呈现独立变化规律(Fig1c)。这种动态波动性加之多样化的患者表型,凸显了营养管理的复杂性挑战。
为了开发 TPN2.0,我们首先采用了一种称为变分神经网络(VNN)的深度学习架构变体,结合了半监督迭代聚类。
2.核心架构:变分神经网络(VNN)
组件
技术细节
功能
输入层

模态1EHR四维特征(1,625项观察值 + 1,037种药物 + 5,607种病症 + 6,230项操作)→ 经自编码器压缩至32维潜在空间
模态216项动态临床指标(胎龄、血清钙、葡萄糖等) + 6项TPN参数(输注途径、液体总量等)

多源数据融合与降维


瓶颈层

16节点变分层(Latent Space)

生成患者-营养需求的联合表征


输出层

16种TPN成分剂量(氨基酸、葡萄糖、钠、锌等),采用标准化剂量单位(如g·kg⁻¹·day⁻¹)

生成个性化处方


损失函数

成分剂量的均方根误差(RMSE) + KL散度(潜在空间正则化)

平衡预测精度与表征稳定性


3.聚类优化:半监督迭代算法
(1)初始过聚类与迭代合并
  • 过聚类阶段:对每种TPN输注类型(如新生儿中心静脉、外周静脉),首先将VNN生成的16维潜在空间表征通过K-means划分为100个初始簇,确保微观营养模式被充分捕捉。计算所有簇对间的欧氏距离矩阵,筛选出距离最小的30对候选簇(约占全空间的0.6%)。
  • 动态合并策略:对每一候选簇对,模拟合并后计算其与真实处方的成分相关性损失(Δρ)。选择使Δρ最小的簇对进行合并,重复迭代直至簇数量收敛至15个,此时进一步合并将导致ρ值断崖式下降(>0.05)。
(2)营养动态追踪机制
  • 簇间迁移逻辑:患者每日潜在空间坐标更新后,重新计算与各簇质心的马氏距离(协方差矩阵加权),实现动态重分配。
(3)物理约束集成:在聚类损失函数中引入边界条件惩罚项
(4)性能平衡验证
  • 簇数量敏感性分析显示:当K=15时,模型在解释力(ρ=0.82)与可实施性(每增加1个簇,生产成本上升12%)间达到Pareto最优。超过20个簇时出现边际效益递减(Δρ/ΔK <0.005),而少于10个簇时ρ值骤降至0.71以下。
    图表明K= 15 之后收益递减,其中较多的聚类数量并没有导致实质性的性能提升来证明实用性下降是合理的。

04 实验设置

1.数据来源与预处理
(1)数据来源
数据集
规模
时间范围
用途
斯坦福(训练)

79,790处方(5,913患者)

2011–2022

模型开发与验证

UCSF(验证)

63,273处方(3,417患者)

2012–2024

外部盲测

(2)数据清洗

  • 排除首次TPN治疗年龄>2岁的患者(避免非典型新生儿营养需求干扰)。
  • 缺失值处理:
    ①5%的胎龄/出生体重数据使用随机森林(missForest)填补。
   ②实验室指标采用最后观测值向前填充(LOCF),若无历史数据则使用队列均值。
2. 模型训练与验证策略
(1)特征工程:
  • 结构化EHR数据:16,499维特征(包括4类:诊断、用药、检验、操作),通过自编码器(AE)压缩至32维潜在空间。
  • 动态营养参数:每日实验室指标(如血钠、钙、白蛋白) + TPN基础参数(液体总量、输注途径)。
(2)训练方法:
  • 交叉验证:按患者分层划分训练集(40%)、验证集(10%)、测试集(50%),确保同一患者的所有处方仅出现在一个分组。
  • 损失函数:均方根误差(RMSE) + 聚类损失(半监督迭代合并)。
(3)对照基准:
  • 传统方法:弹性网络(Elastic Net)回归。
  • 深度学习对比:LSTM、时序Kolmogorov-Arnold网络(KAN)、标准Transformer。
3. 评估指标与临床验证
(1)性能指标:
  • 相关性:TPN2.0推荐与真实处方的Pearson’sR(斯坦福:0.94;UCSF:0.91)。
  • 一致性:同质患者组(通过AE聚类定义)内处方成分的方差降低幅度(TPN2.0 vs 实际处方)。
(2)盲法临床评估:
  • 设计:10名临床医生(含新生儿科医师、药师)对30例患者的三种方案评分(TPN2.0推荐、实际处方、随机处方),共192次评估。
  • 评分标准:0–100分(基于患者完整EHR评估合理性),统计显著性通过Mann-Whitney U检验(双尾)。
(3)结局关联分析:
  • 定义偏离:计算每份处方与TPN2.0的曼哈顿距离,按百分位分组(>80%为高偏离,<20%为高吻合)。
  • 统计方法:
   ①比值比(OR):逻辑回归分析高偏离组 vs 高吻合组的并发症风险(如死亡率、NEC)。
   ②生存分析:Kaplan-Meier曲线比较两组诊断时间差异(对数秩检验)。
4. 外部验证与鲁棒性测试
(1)跨中心验证:
  • 斯坦福训练的模型直接应用于UCSF数据,无重新训练或校准。
  • 验证指标包括:相关性、簇分配合理性、医生评分一致性。
(2)时间偏移测试:将数据按时间划分为三期(2011–2014, 2015–2018, 2019–2022),验证模型在不同时期指南变化下的稳定性。

05 结果与分析

1. 模型性能验证
(1)与专家的一致性
  • 斯坦福数据集:TPN2.0与专家处方的成分级Pearson相关性达R=0.94(P<0.0001),显著优于弹性网络(R=0.62)。
  • UCSF外部验证:模型未重新训练,仍保持R=0.91,证明跨机构泛化能力。
成分差异:
  ①高一致性成分:肝素(R=0.98)、多种维生素(R=0.96)——因临床指南明确。
  ②高变异性成分:葡萄糖(R=0.82)、氨基酸(R=0.85)——反映个体化需求差异。
本研究以同类患者专家处方的差异作为金标准(详见方法部分),图c通过成分级距离分析显示:TPN2.0与专家处方的差异程度,和不同专家之间的处方差异相当。
(2)聚类有效性
  • 15个簇覆盖90%临床场景,进一步增加簇数仅提升R值0.02(边际效益可忽略)。
  • 簇内方差比实际处方降低76%,如脂肪剂量方差从0.67→0.16。
    2. 临床评估结果
    (1)医生盲法评分(n=192)
    TPN2.0平均得分56/100,实际规定的 TPN 和随机 TPN(Mann-Whitney U 检验,双侧 P 值< 0.0001)。
    (2)动态适应性案例
    一名早产儿在低钠血症时,模型自动从簇C7(Na+ 3.1 mEq/kg)切换至C6(Na+ 5.6 mEq/kg),与实际临床调整一致。
    2b:患者轨迹在潜在空间的动态迁移(C3→C1→C7→C6,对应低钠血症调整)。
     2c:各簇成分对比(如C6钠浓度显著高于C7)。
3. 临床结局关联
(1)偏离TPN2.0的风险(>80百分位距离)
网络图:
节点:17种并发症,大小正比于偏离TPN2.0的OR值(如死亡率节点最大);边:粗细表示并发症共现率(如坏死性小肠结肠炎与败血症强关联)。
(2)生存分析:高偏离组诊断中位时间比高吻合组缩短40%(如胆汁淤积:64天→38天,P=8.92×10⁻³²)。
生存图:描述随着 TPN2.0 与实际处方之间距离的增加,病例和对照之间产生结果的速率差异。
4. 资源与效率提升
(1)时间成本:
  • 传统TPN流程:4–12小时(多学科审核+定制配制)。
  • TPN2.0流程:10分钟(自动推荐标准化配方)。
(2)成本节约:15种标准化配方可实现 中央化生产,预计降低药房配制成本30–50%。
5. 模型可解释性
(1)特征归因分析
  • 全局重要性:血清钠、胎龄、出生体重为前3大影响因子。
  • 局部调整:相同特征可能对不同患者有相反影响(如高血钙患者减少钙剂量,低血钙患者增加剂量)。
    a:基于梯度的平均 SHAP(SHapley 加法解释)值的热图可视化了每个选定特征和聚类的全局特征重要性。
    b:力图展示了特征如何在局部患者水平上驱动集群分配。

06 结论

本研究开发的AI驱动精准营养系统TPN2.0通过分析十余年临床数据(斯坦福79,790份处方,UCSF 63,273份外部验证),成功将复杂的个体化TPN方案标准化为15种核心配方,在双中心验证中展现出与临床专家高度一致的决定能力(R=0.94)。该系统不仅被多学科医疗团队盲法评估显著优于现行方案(评分56 vs 35,p<0.0001),更重要的是,偏离AI推荐的处方与死亡率上升5倍、坏死性小肠结肠炎风险增加3.3倍等严重不良结局显著相关。通过创新性地结合变分神经网络与物理约束Transformer架构,TPN2.0在保持个性化营养需求响应的同时,将传统4-12小时的TPN制定流程缩短至10分钟,并支持医生实时干预调整。这一突破既解决了NICU长期面临的TPN标准化与个性化矛盾,也为资源匮乏地区提供了可大规模推广的精准营养解决方案,标志着AI从临床预测向治疗决策支持的关键跨越。后续需要通过多中心随机对照试验进一步验证其改善长期神经发育结局的潜力。

07 论文评价

方法创新亮点

  • AI驱动的标准化TPN配方
首次通过变分神经网络(VNN)+半监督聚类,将复杂的个体化TPN需求压缩为15种标准化配方,既满足临床个性化需求,又支持规模化生产(成本降低30-50%)。
  • 动态适应性营养管理
基于患者实时生理指标(如电解质紊乱),模型自动调整簇分配(如低钠血症切换至高钠配方C6),实现"稳态-应急"双模式调控。
  • 医工协作的决策系统
物理约束Transformer(PI-Transformer)首次整合10项药学指南(如钙磷溶解度),并允许医生修改推荐,干预后模型相关性提升至R=0.78(图6c)。

    方法不足

    模型训练完全依赖结构化电子健康记录(EHR),未整合临床笔记、影像等非结构化数据,可能遗漏关键决策信息(如喂养不耐受描述);当前外部验证仅包含美国两家顶级医疗中心(斯坦福/UCSF),未覆盖资源匮乏地区的真实场景(如缺乏实验室监测的基层医院);结局关联分析基于观察性数据,即使通过倾向评分匹配控制混杂因素(如胎龄、体重),仍无法完全排除残余混杂。

    08 参考资料

    论文链接:

    https://doi.org/10.1038/s41591-025-03691-x
    代码链接:
    https://github.com/tpjoe/TPN2.0




    图文:植洁莹

    编辑:植洁莹

    审核:吴朝



    图片
    精彩推荐


    Nature Communications (一区 IF=15.7) | 基于人工智能的常规乳腺MRI筛查胸主动脉瘤

    Nature Medicine (一区 IF=50) | 基于人工智能的非造影CT成像胃癌大规模筛查

    Npj Digital Medicine(一区IF=8.0)| 深度计算免疫细胞微环境的图像分析揭示了肺癌治疗特异性结果的相关性

    npj Digital Medicine(一区IF=15.1)|人工智能辅助增强眼睑皮脂腺癌和鳞状细胞癌之间的组织病理学区分

    NPJ Digital Medicine (一区 IF=15.1) | 基于表型驱动的罕见遗传病患者诊断的小样本学习

    【声明】内容源于网络
    0
    0
    瓴智医学AI
    分享医学人工智能前沿知识,搭建跨学科研究、合作及应用转化平台。致力于医学人工智能技术、研发及科研,提供医学人工智能全方位服务。
    内容 32
    粉丝 0
    瓴智医学AI 分享医学人工智能前沿知识,搭建跨学科研究、合作及应用转化平台。致力于医学人工智能技术、研发及科研,提供医学人工智能全方位服务。
    总阅读21
    粉丝0
    内容32