大数跨境
0
0

SNP在染色体上的分布图怎么做?代码搞定

SNP在染色体上的分布图怎么做?代码搞定 育种数据分析之放飞自我
2022-09-02
0
导读:SNP密度图绘制!

大家好,我是飞哥,今天星球内有人问SNP密度图的绘制,今天分享一篇博客,介绍一下这种图的绘制方法。


想要更好的学习和交流,快来加入飞哥的知识星球,这是一个生物统计+数量遗传学+GWAS+GS的社区,在这里你可以向飞哥提问、帮你定学习计划、跟着飞哥一起做实战项目,冲冲冲。点击这里加入吧:飞哥的学习圈子



本文绘制这种图:

每个SNP在染色体上的分布图,也称为SNP密度图,不同的颜色表示1Mb内包含的SNP个数。

用到的R包CMplot

安装方法:

install.packages("CMplot")

数据格式

plink的map格式:

1 1_320344 0 320344
1 1_342499 0 342499
1 1_509942 0 509942
1 1_538165 0 538165
1 1_565638 0 565638
1 1_612572 0 612572
1 1_722644 0 722644
1 1_791066 0 791066
1 1_813662 0 813662
1 1_865366 0 865366

也可以只包括三列数据:

  • 染色体
  • SNP名称
  • 物理位置

代码

library(data.table)
library(CMplot)
map1 = fread("re1.map",header = F)
head(map1)

mm = map1 %>% dplyr::select(SNP = 2,Chromosome=1,Position = 4)
head(mm)

CMplot(mm,plot.type="d",bin.size=1e6,col=c("darkgreen""yellow""red"),
       file="tiff",memo="",dpi=300,file.output=TRUE, verbose=TRUE)

CMplot(mm,plot.type="d",bin.size=1e6,col=c("darkgreen""yellow""red"),
       file="tiff",memo="",dpi=300,file.output=FALSE, verbose=TRUE)

结果

很简单有没有!!!


资源推荐:


编程+统计+数量遗传学,可以通过一个包含数据+R代码+原理解释的GWAS教程达到目的,上手一个项目,比着敲代码,一举多得。下面是我精心整理的学习资料,有我编写的GWAS学习教程,有我收集的入门数据分析资源,有我推荐的最新版R语言电子书,以及我翻译整理的统计遗传学分析导论。


这些资料的特点是:代码,数据,理论介绍都有包括,值得拥有:


1,快来领取 | 飞哥的GWAS分析教程


2,飞哥汇总 | 入门数据分析资源推荐


3,数量遗传学,分享几本书的电子版


4,R语言学习看最新版的电子书不香嘛?



想要有人带的小伙伴,毕竟老司机带,不迷路,更快到达!


扫码加入知识星球:


本星球分享和答疑内容包括:全基因组关联分析(GWAS),全基因组选择(GS),生物统计,数量遗传学,遗传参数评估,涉及R语言、Python等工具。2022年和2023年会加入机器学习和神经网络方面的内容,一起学习不孤单。

我也会不定期的分享工作学习中的一些心得,分享一些学习资料,加入星球的都是我的朋友,这里的交流都可以沉淀。让我们在这里学习进步,一起成长吧



【声明】内容源于网络
0
0
育种数据分析之放飞自我
本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
内容 912
粉丝 0
育种数据分析之放飞自我 本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
总阅读390
粉丝0
内容912