搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
百科
导航
知识体系
工具箱
更多
找货源
跨境招聘
DeepSeek
首页
>
如何进行群体遗传结构分析?
>
0
0
如何进行群体遗传结构分析?
爱基百客生物
2026-01-09
0
导读:三大分析方法联动,从系统发育树到祖先构成,层层解码群体遗传结构的核心图谱。
群体遗传结构,作为群体遗传学的核心研究目标与关键产出,旨在揭示遗传变异在群体中的时空分布格局。在众多相关研究中,由系统发育树、主成分分析与ADMIXTURE等经典方法共同构成的整合分析图谱,已成为解码这一格局的“标准密码”(图1)。今天,我们将共同学习如何从重测序数据出发,一步步完成这份核心图谱的构建。
图
1
群体遗传结构示例
图a系统发育树,观察各枝分布来判断群体的聚类情况。图b主成分分析,不同的颜色代表了不同的群体,观察不同颜色样本在坐标图中的位置来判断群体演化特征。图c
交叉验证误差统计图,
折线图最低点对应的
X
轴为最佳分群数。图d群体分层分析,不同颜色代表不同假设祖先群体,观察k为最佳分群数时的祖先来源构成,来推断样本的混杂或分化历史。
01
系统发育树
首先,我们通过系统发育分析来解析样本间的聚类情况。整个流程从遗传距离计算开始:我们使用
VCF2Dis
软件
(https://github.com/BGI-shenzhen/VCF2Dis)
,它能基于包含样本数据的VCF文件,计算出标准化的群体间遗传距离矩阵
(图2)
。获得遗传距离矩阵后,可将其上传至在线
工具
FastME 2.0
(http://www.atgc-montpellier.fr/fastme/)
,选择“Distance matrix”格式并设置相应参数,提交任务后即可通过
邮件
获取系统发育树文件(.nwk格式)。最后,将该文件导入
iTOL
在线平台
(https://itol.embl.de/upload.cgi)
,即可对系统发育树进行查看、编辑与美化,从而直观展示群体间的遗传结构与聚类情况。
图
2
VCF2Dis
软件
使用
02
主成分分析
虽然我们通过系统发育分析可以知道群体中的分群情况,但是系统发育分析却不能反映个体在宏观遗传空间中的位置。这个时候我们就需要利用主成分分析
找出能最大程度解释遗传变异的前几个主成分,并将每个样本投射到这个由PC构成的二维/三维“地图”上。通过主成分分析可以知道群体主要的分化方向
,
是连续渐变还是离散聚类以及找群体中的离散个体(图
3)。这个过程我们使用
P
link
计算主成分,使用
R
语言(
https://posit.co/download/rstudio-desktop/
)进行可视化绘图。
图
3
主成分计算
图
4
R语言绘图
03
群体分层分析
通过主成分分析与系统发育分析,我们已初步揭示了样本间的聚类关系与遗传分化格局。然而,这些方法尚不能回答一个更为本质的问题:这些个体究竟源自多少个潜在的祖先群体?为了追溯群体的混合历史并量化个体的祖先来源构成,我们需要借助群体分层分析。以
ADMIXTURE
为代表的方法,能够推断每个个体基因组中来源于K个假设祖先群体的比例,并通过交叉验证确定最优的K值。该分析对于发现隐蔽的遗传亚群、识别混合或异常个体具有关键作用。
图
5
群体遗传分层分析
图
6
admixture的结果文件
通过对系统发育、主成分与群体分层分析的综合解析,我们已对群体的遗传结构有了基本的认知。然而,这些初步结果尚未充分揭示群体内各组分之间的遗传差异程度、分化水平及其内在联系。因此,为深入理解群体结构与演化动态,后续有必要开展更为精细的遗传分析,如:群体遗传分化指数分析,遗传多样性分析以及基因流分析等等。
这些分析将帮助我们更完整地刻画群体的遗传格局与演化历程。后续内容我们
下次再一起学习。
项目咨询
了 解 更 多
{ 往 期 精 彩 回 顾 }
解锁基因密码之重测序(从测序到分析)
重测序项目文章 | Fungal Diversity(IF:20.3)发表杯伞科真菌系统分类和毒蝇碱进化的研究
时光不语,研究有果,爱基百客2025项目文章盘点
解码WRKY转录因子——调控植物生长与逆境响应的核心枢纽
点个「在看」 天天发SCI
【声明】内容源于网络
0
0
爱基百客生物
爱基百客是一家专业提供表观组学、单细胞与空间组学以及高通量测序分析的新型生物科技服务企业,旗下拥有DNBSEQ-T7、10xGenomics等平台,依托表观技术的优势,为生命科学研究和医疗健康等领域提供方案设计到数据分析一站式服务。
内容
436
粉丝
0
关注
在线咨询
爱基百客生物
爱基百客是一家专业提供表观组学、单细胞与空间组学以及高通量测序分析的新型生物科技服务企业,旗下拥有DNBSEQ-T7、10xGenomics等平台,依托表观技术的优势,为生命科学研究和医疗健康等领域提供方案设计到数据分析一站式服务。
总阅读
65
粉丝
0
内容
436
在线咨询
关注