大数跨境
0
0

GWAS学习 | 01-分析路线图

GWAS学习 | 01-分析路线图 育种数据分析之放飞自我
2021-02-22
0
导读:初学GWAS,应该知道,GWAS是干什么用的?我的理解,GWAS分为四部分:

这是一个读者给我写信询问的问题:

初学GWAS,应该知道,GWAS是干什么用的?我的理解,GWAS分为四部分:

1. 数据清洗

1.1 表型数据清洗

删除异常值查看数据分布数据可视化

1.2 基因型数据清洗

MAFCall rateHWE

2 关联分析

2.1 一般线性模型GLM

2.2 混合线性模型

3 结果可视化

3.1 PCA群体结构

3.2 QQ图

3.3 曼哈顿图

3.4 LD衰减图

4. 结果注释

4.1 显著SNP注释

ANNOVARsnpEFF

4.2 基因聚类分析

GO 富集分析Kegg 通路分析

上面是我之前做的汇总。

整体而言, plink可以手动进行:

基因型数据质控MAFgenoHWE建模GLM模型(连续性状)logistic模型(二分类性状)

TASSEL

窗口化界面不用编程,鼠标点点点需要提前将表型数据和基因型数据整理好模型 GLM模型LMM模型可视化QQ图曼哈顿图LD衰减图

可以看到,TASSEL比较有优势,特别是它具有LMM模型,LMM模型是连续性状主流的分析方法。

其它GWAS分析软件

R包:GAPITR包:FamCPUR包:rMVPGEMMA

很多都是相通的,学习一种方法,其它软件也能很快入手。比如我先是用GEMMA,然后GAPIT和TASSEL也能很快上手。

后面,我将之前的文档,重新整理一下,按照这个流程,重新整理一份GWAS cookbook,岂不善哉!


【声明】内容源于网络
0
0
育种数据分析之放飞自我
本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
内容 912
粉丝 0
育种数据分析之放飞自我 本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
总阅读384
粉丝0
内容912