大数跨境
0
0

Biorxiv | Gladyshev院士:自主AI智能体从数百万分子图谱中发现衰老干预措施

Biorxiv | Gladyshev院士:自主AI智能体从数百万分子图谱中发现衰老干预措施 图灵基因
2025-12-09
0
导读:研究构建的ClockBase Agent平台整合204万份人类和小鼠甲基化与RNA-seq公共数据,通过40余种衰老时钟模型全自动化分析43,602组干预-对照实验,发现超500种干预措施显著降低生物
图灵基因掌上数字切片扫描仪, 开启个人显微数智化新时代
微信号:aipathology  邮箱:product@turingene.com

撰文:一粟尘

推荐度:⭐⭐⭐⭐⭐

亮点:

研究构建的ClockBase Agent平台整合204万份人类和小鼠甲基化与RNA-seq公共数据,通过40余种衰老时钟模型全自动化分析43,602组干预-对照实验,发现超500种干预措施显著降低生物年龄。核心发现包括:疾病状态显著加速衰老;功能缺失型遗传干预(敲除/敲低)抗衰老效果优于功能获得型策略;97.4%的基因与98.2%的药物靶点未在现有衰老数据库收录。实验验证证实AI筛选的乌本苷可延缓老年小鼠衰弱、改善心功能并抑制神经炎症。该平台开创了AI智能体自主挖掘历史数据的新模式。

    今日,由哈佛医学院布莱根妇女医院Vadim N. Gladyshev教授斯坦福大学应可钧博士领衔的国际团队,在预印本平台bioRxiv发表题为Autonomous AI Agents Discover Aging Interventions from Millions of Molecular Profiles的研究。Gladyshev团队长期致力于衰老的表观遗传调控机制研究,此次联合计算生物学、人工智能及临床医学专家,构建了首个能系统性挖掘衰老干预措施的AI平台,为延长健康寿命提供了突破性工具。

    衰老是慢性疾病与死亡的核心风险因素,但系统性筛选衰老干预策略仍面临巨大挑战。近年来,基于机器学习开发的衰老时钟Aging Clocks)通过DNA甲基化、转录组等分子标志物,实现了对生物年龄和死亡风险的精准预测。从第一代仅预测时序年龄的模型(如Horvath时钟),到第二代整合表型与死亡风险的时钟(如GrimAgePhenoAge),再到因果增强模型(如CausAge)及模块特异性转录组时钟,技术迭代显著提升了衰老评估的分辨率。

    然而,公共数据库中积累的数百万分子图谱——涵盖遗传干预、药物处理、疾病模型及环境暴露——虽为衰老研究提供宝贵资源,却因原始研究目标未聚焦衰老领域,导致其潜在价值长期未被发掘。例如,多数研究仅关注疾病机制或药物反应,从未评估干预措施对生物年龄的影响。传统人工分析受限于预设立场和工作量,难以系统性挖掘这些数据。随着大语言模型与AI智能体技术的发展,自主化、规模化重分析海量数据成为可能ClockBase Agent应运而生,旨在将整个分子研究历史转化为衰老干预发现引擎

研究设计

       ClockBase Agent通过三层架构实现全流程自动化分析:数据整合层统一处理204.87万份人类和小鼠样本(人类甲基化230,516份、小鼠甲基化1,749份、人类RNA-seq 852,381份、小鼠RNA-seq 964,083份),标准化标注疾病、遗传扰动和药物干预等元数据;多智能体系统部署专用AI智能体执行自主工作流,涵盖元数据解析、衰老假设生成、统计方法选择(基于样本量与方差同质性选用t检验/Welch检验/线性模型)、文献检索(基于轻量化RAG框架索引6000+衰老领域论文)及复合评分(整合生物学合理性等8项指标);交互平台提供在线查询与统计分析功能。核心技术在于应用40种衰老时钟模型(39种人类甲基化时钟、4种小鼠甲基化时钟、4种跨物种转录组时钟)预测生物年龄,并通过严格质控(样本量≥3、离群值剔除、FDR校正)确保分析鲁棒性,最终完成43,602组干预实验的再分析。

研究结果

1. 200万个样本的生物年龄综合图谱

    为构建覆盖广泛的衰老研究资源库,研究系统整合了公共数据库Gene Expression Omnibus中的人和小鼠DNA甲基化、RNA-seq样本数据共2,048,729个样本(图1)。通过统一数据预处理与标准化流程,应用覆盖40余种衰老时钟模型(包括人类DNA甲基化时钟39种、小鼠甲基化时钟4种、跨物种转录组时钟8种)进行生物年龄预测(图2)。

    人DNA甲基化样本的UMAP降维分析显示,样本聚类模式与生物年龄梯度高度吻合(图2b),其中婴儿组织、胎盘及表观遗传酶缺失细胞系的样本形成独立聚类。交互式平台支持实时查询与在线统计分析(如组间比较、相关性分析等),建立迄今为止最全面的生物年龄公共图谱,为衰老干预规模化研究奠定基础。

1. ClockBase Agent平台架构和工作流程

2. 人类和小鼠分子图谱的综合生物年龄图谱

2. AI智能体系统识别改变年龄的干预措施

    部署基于AI智能体的分析框架(Claude 3.7 SonnetGPT-4O),对13,211个小鼠RNA-seq数据集执行标准化分析流程(图1b)。经过严格的样本质控与离群值过滤(去除技术噪声数据619个),共分析43,529组干预-对照比较,涵盖基因扰动(20,033组)、药物处理(7,933组)、环境暴露(4,459组)及疾病模型(3,416组)。结果表明,5,756组(13.2%)干预措施具有显著影响生物年龄的效应(图3a)。

    智能体通过综合评分系统(权重涵盖生物学合理性、实验模型质量、衰老通路相关性等9项指标)验证干预优先级排序的有效性。例如,基因干预IRF4敲除、Bach2过表达、miR-155过表达显著降低生物年龄(图3b)。药物干预:强心苷类化合物哇巴因mTOR抑制剂雷帕霉素、PPARα激动剂非诺贝特显著延缓衰老(图3c)。环境暴露:机械性负荷损伤后联合清除衰老细胞治疗显著降低生物年龄,而高强度光照与慢性缺氧显著加速衰老(图3d-e)。

3. AI智能体在小鼠RNA-seq数据集中识别了年龄调节干预措施

3. 改变年龄干预措施的系统特征

    系统分析表明不同干预类型存在显著模式差异(图4a-b)。效应方向:与衰老延缓干预(13.2%)相比,加速衰老的干预占比更高干预效果强度:病理模型显著率最高(24.3%,如缺血再灌注损伤β=8.92、病毒感染β=10.18),环境暴露(15.2%)、药物处理(11.3%)与基因干预(10.0%)紧随其后。基因干预策略:损失性功能(敲降/敲除)方法在延缓衰老方面显著优于增益性功能策略,与过表达或突变相比具有1.851.45倍的抗衰老富集倾向(图4c-d)。

    通路富集验证:显著影响生物年龄的基因靶点显著富集于细胞衰老(FDR<0.05)、长寿调节通路等经典衰老机制(图4e),证实分析反映真实生物学信号而非技术假象。已有数据库比对:与GenAge数据库比较发现,81.0%17/21)干预效应方向一致,而DrugAge数据库匹配药物的一致性达100%5/5)(图4g-h)。值得注意的是,97.4%的基因干预项未见相关衰老研究报道,表明本研究揭示了大量新干预靶点。

4. 干预类别和生物验证的系统分析

4. 智能体操作模式展示了复杂的分析能力

    通过对17,695AI智能体操作轨迹的分析,证明其分析方法高度复现专家决策逻辑(图5a-c):智能体依次执行元数据解析、实验设计评估(识别处理组、对照与协变量)、统计方法选择(依据样本量与方差同质性选取t检验、Welch检验或线性模型)。人工验证100组随机分析结果显示,在统计方法选择、p值有效性、效应量计算等维度准确率达标准(延伸数据图4)。

    综合评分系统将干预措施分为三级(图5d-f)。高评分(≥100分):占比33.7%,具有实验质量高、机制相关性强等特点,如E2F4敲除(评分140)、Snf2h敲除(139)、FNDC5敲除(138)。中评分类:生物合理性加分(占比40.5%+30分)或基础合理性扣分(占比12.3%-50分)。低评分类:生物相关性差(评分<0,例如年龄相关疾病错误归类为抗衰干预)。智能体评分框架有效平衡实验质量与机制创新(图5i-k),为后续验证提供量化依据。

5. AI智能体操作流程和多维评分系统

5. 哇巴因验证证明了对老年小鼠的治疗效果

    为实验验证AI预测,本研究选取转录组生物年龄评分最高的化合物哇巴因进行动物实验(图6)。结果表明,分子层面26月龄雌鼠经哇巴因治疗13周后,死亡率相关的多组织生物时钟预测的tAge显著降低(图6a);Nrep基因表达显著上调(图6b),该基因在异龄共生中亦参与衰老逆转。

    表型层面20月龄雄性小鼠间歇性给药3个月后,哇巴因组衰弱指数(Frailty Index)显著低于对照组(图6e),且未出现对照组随时间的衰弱指数显著上升(图6f)。具体表现为脱毛减少、惊吓反射保留、震颤减轻等多项指标显著改善(图6g)。

    器官功能:超声心动检测显示哇巴因组老年雄性心输出量显著增高(图6i-j);海马区小胶质细胞分支数量与连接点增加,表明神经炎症降低(图6l-m)。代谢特征(间接能量消耗)、身体成分随时间的变化两组无显著差异。

6. 哇巴因对老年小鼠保护作用的实验验证

6. 研究讨论与结果

       ClockBase Agent代表了从假设驱动研究向数据驱动发现的研究方式转变。通过将AI智能体与分子衰老时钟结合,该平台首次实现对历史研究数据的系统性再挖掘,揭示了隐藏的衰老干预宝库。未来,这一框架可扩展至多组学数据(如蛋白质组、代谢组),并推动个性化抗衰老策略的开发。研究团队已公开全部数据与平台,呼吁全球合作以加速衰老干预措施的临床转化。

教授介绍

       Vadim Gladyshev教授是哈佛医学院医学教授、布莱根妇女医院氧化还原医学中心主任,并任职于布罗德研究所。Gladyshev的实验室致力于结合实验与计算生物学方法,研究衰老、再生与寿命控制的机制。他已发表约500篇学术论文。Gladyshev是美国国立卫生研究院(NIH先锋奖变革性研究奖尤里卡奖的获得者,并当选为美国国家科学院院士。

    应可钧博士,现为斯坦福大学博士后研究员,专注于衰老系统生物学研究,隶属Wyss-Coray实验室和蛋白质设计研究所Baker实验室,获NIH/NIA K00学者资助。应博士于2025年获得哈佛大学生物学博士学位,2024年获得哈佛大学计算科学与工程硕士学位,师从Vadim Gladyshev教授。

参考文献

Kejun Ying, Alexander Tyshkovskiy, Alibek Moldakozhayev, et al. Autonomous AI Agents Discover Aging Interventions from Millions of Molecular Profiles. bioRxiv 2023.02.28.530532.


>>>关于我们<<<

2024年热文TOP10

1Cell 樊代明院士团队揭示补充牛磺酸增强T细胞抗肿瘤疗效机制

2Nat Rev | 肿瘤微环境如何驱动癌症

3Nature | 科学家发现新的线粒体自我修复系统

4Nature刚拿诺奖的David Baker新作:从零合成EndoTags蛋白,放大内吞信号,靶向降解蛋白

5Cell | 复旦大学建立中性粒细胞图谱并阐明其抗肿瘤过程中的抗原呈递作用

6Cell华中科技大学发现肿瘤免疫治疗新靶点

7Mol Cancer | 徐州医科大学发现M6A修饰介导上调FASN调节脂肪酸代谢,促进结直肠癌生长

8Nat Cancer | 复旦邵志敏团队:中国乳腺癌多组学特征

9Nature感觉神经直接与肿瘤相互作用帮助癌症扩散

10Cancer Cell | 上海交大团队发现表观遗传导致CAFs异质性促进胰腺癌


图灵基因掌上数字切片扫描仪, 开启个人显微数智化新时代
微信号:aipathology  邮箱:product@turingene.com

【声明】内容源于网络
0
0
图灵基因
开创个人显微数智化新时代
内容 2625
粉丝 0
图灵基因 开创个人显微数智化新时代
总阅读73
粉丝0
内容2.6k