位点的Splice-AI在线预测
剪接变异的预测工具相比错义突变要少一些,现在用于剪接位点预测的工具包括ensembl ADA(拓扑功能结构域)和RF(随机森林)算法,此外还有illumina公司的Splice-AI算法。
Splice-AI是illumina公司基于深度学习技术开发的剪接预测算法,基于月32种神经网络算法开发的,针对遗传病可以进行相关预测。以往如果没有生信基础,可能比较难查询某一变异的Splice-AI预测值,我们就可以借助Broad institution做的spliceailookup网页,无需翻墙,就可以方便查询:https://spliceailookup.broadinstitute.org/
图1 在线预测软件首页
使用很方便,直接在页面首页,“Enter a variant”处输入变异的坐标,可以是基因组坐标,如chr8-140300616-T-G,或者chr8 140300616 T G;也可以是变异的HGVS命名:

图2 部分变异输入示例
注意:我个人比较推荐用基因组坐标来书写变异。因为转录本的不同,左右对齐不一定标准,hgvs可能存在误差,而基因组的物理坐标是唯一的,所以推荐用基因组坐标来书写变异。
输入变异后,需要注意选择好参考基因组版本:
图3 参考基因组选择
而score type 中,推荐选择raw预测是否影响剪接;而用masked预测单核苷酸变异是否有害。
图4 预测类型
Raw参数代表原始的Splice-AI分数;
Masked是修饰过的分数,

图5 预测距离
Splice-AI默认对阅读框周边50bp的变异进行相关预测,这一范围可以调整,最大可以达10000bp。
图6 是否采用illumina预注释数据
Illumina对GENCODEV24的标准转录本中的所有的SNP和小的indel变异做了SpliceAl的预测值。如果选择使用illumina提前预测的结果,我们将预先使用预先注释好的Splice-AI值,如果这一变异没有提前预测过,我们会继续进行Splice-AI预测。如果不用illumina的数据,将会重新预测,所花时间可能会更长;虽然时间长,但是数据会更全。此处咱们就根据自己的实际情况,选择是否需要选用。
对各类数据库的功能、用法感兴趣?想知道更多使用技巧?
点击 关注我们 聊更多遗传工具话题

