大数跨境

Q&A——tagSNP筛选之Trouble Shooting/FAQ

Q&A——tagSNP筛选之Trouble Shooting/FAQ 基因快讯
2017-10-30
1
导读:答疑,此刻见~

之前小编整理了tagSNP的筛选教程分享给大家,如果有没看到的盆友们可以在本文最下方寻找链接查看~

今天给大家带来的是针对筛选过程中遇到的问题/errors整理的一些FAQ/Trouble Shooting:


Q1



千人计划查找vcf文件时,输入基因名后显示找到了多个Gene Product,该选哪一个?


  A

可在NCBI数据库上查找目的基因的Gene Symbol,看Human物种,如下图,STING基因的Gene Symbol名为“TMEM173”,然后再回到千人网站去找对应结果。

Q2



直接在NCBI数据库中查找基因所在染色体区域可以吗?


  A

可以的,但一定注意必须选择GRCh37版本的,这样才能与1000 Genomics数据对应。

Q3



安装haploview时提示安装失败,提示java文件损坏该怎么办?


A

可参考https://wenku.baidu.com/view/4f246e7ac5da50e2524d7fd3.html链接中教程。Q4

Q4


数据导入Haploview软件时报错,提示“Column number mismatch in ped file. line 101”,怎么办?



A

表示ped文件中存在数据缺失,解决方案:ped文件是可以通过txt文档打开的,打开后复制所有数据至excel表格中(比txt方便查看和编辑),即可看到下图所示数据,“line 101”指的就是“CHB_101”排数据存在缺失,下拉表格,再往后找,把缺失的位置填上“0 0”(注意中间有空格,表示该位点对应的该样本分型结果不明),保存,再导出后缀为.ped的txt文档即可。

注:由于不能识别A/C/G/T,故用数字代替,1代表碱基A,2代表碱基C,3代表碱基G,4代表碱基T。

Q5



数据导入Haploview软件时报错,提示“More than two alleles at marker 1”,怎么办?


A

表示marker 1存在不止两个等位,因为Haploview软件只可分析二等位结果,解决方案;同上述操作相同,将ped文件复制到excel表格中,找到Marker 1 column(从第7列开始算),比对该列数据,可通过筛查的方法找到哪个数据出了问题,找到后可将数字改成“0 0”。

Q6



如果想把5’UTR和3’UTR区域也包含进去找TaqSNP,怎么办?


A

在千人/NCBI上找到的染色体区域基础上,前后各扩大2kb即可(500bp-2kb都可以,没有明确的标准)。

Q7



为什么同一基因、相同染色体区域、软件参数相同条件下查找出来的tagSNP不一样?


A

因为Haploview在选tagSNP的时候是随机的,每次结果不一样,但对结果是没有影响的,比如说苹果、橙子、香蕉都代表水果,那么随机挑其中两样得到的结果也是水果,这种的话就会有3种组合,不过一般最终倾向于选择有功能的SNP往下研究。



以上即为小编自己在操作过程中遇到的问题,参照上述基本可顺利完成tagSNP筛选这一步骤,最后祝有这方面课题的小伙伴们科研顺利~


往期分享:

1. 干货:如何利用1000 Genomes数据挑选tagSNP?

2. 什么,多倍体、同源性高的SNP位点也能做?!

3. KASP SNP分型技术经验分享(一)

4. KASP SNP分型技术经验分享(二)



【声明】内容源于网络
0
0
基因快讯
基因生物技术国际贸易(上海)有限公司拥有仪器,试剂,市场与技术支持,售后等各部门组成的完整体系,是国内生命科学领域主要供应商之一,代理国际一流的高科技产品。积极利用公众号,进行最新资讯的共享,希望得到您的关注和支持。
内容 874
粉丝 0
基因快讯 基因生物技术国际贸易(上海)有限公司拥有仪器,试剂,市场与技术支持,售后等各部门组成的完整体系,是国内生命科学领域主要供应商之一,代理国际一流的高科技产品。积极利用公众号,进行最新资讯的共享,希望得到您的关注和支持。
总阅读445
粉丝0
内容874