大数跨境
0
0

Hot Topics in AI for Sciences | 5′ UTR语言模型为蛋白质表达的预测和优化提供了新的视角

Hot Topics in AI for Sciences | 5′ UTR语言模型为蛋白质表达的预测和优化提供了新的视角 沪渝人工智能研究院
2024-04-11
0
导读:4月17日 10:00,扫码预约直播

2024

·自然科学研究院·


AI FOR SCIENCES

系列讲座

/ 07



5′ UTR语言模型为蛋白质表达的预测和优化提供了新的视角

时间4月17日  10:00

报告人:褚晏伊, 斯坦福医学院与普林斯顿电气与计算机工程系联合培养博士后研究员



Bio

主讲人介绍

褚晏伊

博士后研究员

目前担任斯坦福医学院丛乐教授与普林斯顿电气与计算机工程系王梦迪教授联合指导的博士后研究员。此前在上海交通大学获得致远荣誉博士学位,导师为魏冬青教授;并在卡尔加里大学进行联合培养博士研究,师从Dennis Salahub教授。


研究领域:主要集中在开发语言模型和生成模型,以促进RNA疫苗设计的创新。从2021年至今,共发表5篇第一作者论文,其中在Nature Machine Intelligence上发表了关于HLA-多肽预测及新抗原设计和5' UTR预测及设计的两篇论文,在Briefings in Bioinformatics上发表了关于药物-靶标相互作用和miRNA-疾病相互作用的三篇论文。这些出版物累计获得了666次引用,H指数达到13。


Abstract

报告摘要

5′未翻译区域(UTR)位于信使RNA(mRNA)分子的起始部位,是一个关键的调节区域,对翻译过程及蛋白质表达水平具有重要影响。近年来,语言模型在解码蛋白质和基因组序列功能方面展现出了显著的有效性。本研究开发的5′UTR语言模型(UTR-LM),在多物种的内源性5′UTR上进行了预训练,并结合二级结构和最小自由能等监督信息进一步加以强化,以增强其预测能力。UTR-LM在多个下游任务中进行了微调,其在预测平均核糖体负载、mRNA翻译效率和表达水平等关键指标上均显示出优于现有基准方法的性能。此外,模型还成功应用于识别未注释的内部核糖体进入位点(IRES),在这一任务上的表现同样超过了基准方法。另外,本研究的另一重要成果是设计了一个包含211个新5′UTR的库,这些UTR根据模型预测的翻译效率进行了筛选。湿实验结果验证了这些新设计的5′UTR在提高蛋白质生产水平方面的有效性,其中表现最佳的top-1 5′UTR将蛋白质产量提高了32.5%,相比于传统的基准5′UTR。










【声明】内容源于网络
0
0
沪渝人工智能研究院
重点聚焦在大语言模型、AI医药、AI新材料、量子计算等国家高度关注的领域进行研发和产业应用,打造多学科交叉研究的科研攻关团队和全生态高端人工智能产业平台,培育建设具有区域特色和产业支撑能力的研发中心、重点实验室等协同创新平台
内容 155
粉丝 0
沪渝人工智能研究院 重点聚焦在大语言模型、AI医药、AI新材料、量子计算等国家高度关注的领域进行研发和产业应用,打造多学科交叉研究的科研攻关团队和全生态高端人工智能产业平台,培育建设具有区域特色和产业支撑能力的研发中心、重点实验室等协同创新平台
总阅读3
粉丝0
内容155