(全文共有1411字,预计阅读3分钟)
为了在早期药物发现中构建理想的数据库,DrugFlow平台目前已经开发并集成了ADEMT、ChemFH(点击可阅读全文),目的是从化学库中筛选出具有不理想性质的分子。考虑到筛选的易解释性和高效性,DrugFlow集成了基于子结构的筛选模块SA,目的是筛选出化学库中导致分子具有毒性的子结构。SA集成了各种类型的毒性子结构,进而构建了一个全面的警示子结构库。
本文要点:
1 背景
2 SA警示子结构模块
3 在线SA模块的使用
安全性和有效性是药物的两个基本属性,因此安全性是药物研发的重点关注问题。许多候选药物因安全性问题而导致临床开发失败,据统计,有超过20%的进入临床研究的候选药物因安全性问题而被淘汰;同时,还有许多上市药物因安全性问题而被撤市。因此全面评估分子毒性是非常重要的。
评估分子毒性的计算机方法大致可分为定性定量模型构建、警示子结构识别、毒性机制阐明等几类,其中警示子结构(Structure Alerts,SA)具有简洁直观的作用,更易被化学家接受。警示子结构是指对化合物毒性起关键作用的子结构或子结构组合,研究人员通过警示子结构,可以快速识别潜在的毒性化合物,并对其进行结构优化以降低毒性,因而在药物设计和环境风险评估等方面具有重要的意义。
DrugFlow的SA模块中集成了各种类型的毒性子结构,进而构建了一个全面的警示子结构库,类似于专家系统。如果一个分子中出现某种警示子结构,则提示该分子很可能具有某种毒性,因而研究时需要提高警惕。目前,SA模块包含来自13个出版物的1827种子结构,主要分为10种类型。SA子结构的分类及数量信息表1所示,SA子结构可视化如图1所示。

Acute toxicity Rule:口服急性毒性子结构
Genotoxic carcinogenicity Rule: 遗传毒性致癌性或致突变性子结构
NonGenotoxic carcinogenicity Rule: 非遗传毒性致癌性子结构
Skin sensitization Rule: 皮肤致敏性子结构
Aquatic toxicity Rule: 对水生生物的毒性子结构
Biodegradable Rule: 生物降解性子结构
Nonbiodegrable Rule: 不具生物可降解性子结构
SureChEMBL Rule: SureChEMBL总结的不利于成药的子结构
FAF-Drugs 4 Rule: FAF-Drugs中总结的毒性警示子结构

值得注意的是,SA模块还集成了频繁命中(Frequent Hitters)化合物的子结构。频繁命中化合物是指在多个生物测试中都能产生“活性”信号的化合物,这种活性可能来源于胶体聚集化合物、自荧光化合物、荧光酶抑制剂和化学易反应化合物。遇到这些实验干扰引起的假阳性化合物,研究人员需要对阳性结果的真实性进行反复确认。
目前,我们的DrugFlow平台已上线SA模块,集成了上述模型。
链接:https://drugflow.com/#/admet_sa?tab=submit_task
该模块支持三种分子结构的输入形式,包括绘制分子结构、输入分子SMILES以及上传SMILES文件。用户提交任务后,系统会自动对输入分子进行标准化处理并匹配分子的子结构。在结果展示页面,预测结果会以表格形式进行展现,在结果列表中可以看到该分子在某类别下的子结构警告数量,通过点击该数字,可以看到相应的子结构警告。此外用户可以用户可对这些类别进行排序、筛选。

在SA模块中,用户可根据分子中是否含有相应的子结构,快速识别潜在的毒性化合物,或者频繁命中化合物,快速,简洁且直观。用户可根据不同的情景使用SA模块。首先,在药物研发初期,高通量虚拟筛选过程中,用户可以根据SA的结果,筛选掉具有潜在毒性化合物。其次,在药物研发后期,发现候选化合物具有某种毒性,直接放弃代价太大,用户可以考虑识别其警示子结构,然后针对毒性子结构进行改造,从而降低其毒性。
如果您对该模型有兴趣,可以到文末加小编微信,拉您入群。
关于碳硅智慧 (www.carbonsilicon.ai)
碳硅智慧是一家聚焦于新药研发的科技公司,我们的定位是新药研发领域的人工智能基础设施和服务提供商。希望将最先进的生命科学技术与人工智能等信息科学技术深度融合,面向新药研发领域,利用人工智能、物理计算,以及自动化软硬件技术,三轮驱动,通过提高新药研发领域生产数据、管理数据以及对数据进行AI建模的能力,将新药研发的各个环节数字化和智能化,解决新药研发难题。
关于DrugFlow (www.drugflow.com)
DrugFlow是由碳硅智慧研发的AI驱动的新药发现SaaS平台,其创造性地将人工智能与物理计算技术深度结合,在提升底层计算模型精度的同时,还提供了优秀的数据管理能力,以此构建了一个涵盖靶标发现与验证,先导化合物发现和先导化合物优化等药物发现全过程的一站式计算平台。
