
近日,在继 ChatGPT 取得巨大成功之后,OpenAI 再次公布了其更为重量级的里程碑进展:一个多模态语言模型、升级版的 ChatGPT——GPT-4 。在公告中,OpenAI 这样写道:
“我们创建了 GPT-4,这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,给予文本输出),虽然在许多现实世界场景中的能力尚不如人类,但其在各种专业和学术基准上表现出人类的水平。”

这是一项很可能将会影响人们日常生活的重大突破,GPT-4 来了,SynBioGPT 还会远吗?值得一提的是:GPT-4 所运用的核心人工智能技术 —— 生成模型和大规模语言模型,其实,已经被智峪生科广泛地应用于了合成生物学领域。
首先,在蛋白质结构预测方面,智峪生科联合港中文与复旦开发了一套新的蛋白质语言模型 —fastMSA,它能够高速提升多序列联配构建速度。基于该算法,智峪生科打造了独有的 fast AlphaFold2 方法,该方法能够在几乎不丢失预测精度的情况下,将预测效率加速近百倍。

图:fastMSA 整体流程
其次,在蛋白质元件设计方面,智峪生科团队自研了一套基于生成扩散模型的高精度蛋白质设计框架,该框架可以通过输入目标蛋白质的设计要求,如结构约束、结构稳定性、生物活性等,来生成一系列具有高度多样性和优良性能的蛋白质结构 / 序列,进而选择最优序列用于后续实验或应用。
之后,在 RNA 元件优化方面,智峪生科团队也开发了一套自研的 AI 系统,其中就包含了大规模自监督的 RNA 序列语言模型。该技术处于全球领先地位。在去年的 CASP15 比赛中的 RNA 结构预测项目中,智峪生科旗下的 AICHEMY-RNA 团队是所有基于 AI 算法的团队中的 “全球最优”。

除此之外,在基因表达优化方面,智峪生科也正在深入布局。公司已经开发了基于生成式 AI 的调控元件的设计和密码子优化等算法,这些算法可以根据不同的基因表达需求,自动生成出最优化的调控元件序列,以达到精准调控基因表达的目的。
目前,智峪生科所打造的 AI 计算平台 “峪云 ZCloud” 已经大幅提高了元件挖掘与设计的效率,将合成生物学管线的研发周期缩短为原来的 1/3,这其中,某款医药中间体产品仅在 6 个月内便完成了从研发到生产再到销售的全周期,充分证明了公司计算平台强大的商业化应用能力。
随着人工智能的快速发展,可以预见的是:在将来的合成生物学工作流程中,人工智能无疑将会发挥越来越重要的作用。未来,智峪生科也将进一步地夯实自身 AI 技术,加快将最前沿的 AI 技术拓展至合成生物学的从设计到研发再到生产的多个维度,推动合成生物学迈向具有可预测性的 “理性设计”。
上海智峪生物科技有限公司成立于 2021 年,由来自国内外知名学府及工业界经验丰富的大分子结构预测与设计以及合成生物学团队发起,主营业务包括大分子(包括:蛋白、RNA 等)结构计算、设计及改造服务;合成生物学相关元件、产品的设计和生产。公司具有业内极具竞争力的 AI 技术水平和合成生物学产业能力,通过 AI 不断拓展生物科技边界,通过已知数据挖掘未知领域,通过设计工具从无到有创造,赋能合成生物学 DBTL 各个环节从而达到降本增效,推动医疗健康、农业、食品、消费、化工等行业共同发展。关于智峪生科的更多信息,请访问 https://www.zelixir.com


