大家好,我是邓飞,今天介绍一下孟德尔随机误差和GBLUP的关系,解释一下为什么GBLUP方法会比基于系谱的ABLUP方法更准确。
一、孟德尔抽样误差的本质
孟德尔抽样误差(Mendelian sampling error)是指个体育种值与父母平均育种值的离差,用数学表达为:
其中:
-
a_i:个体 i 的育种值 -
a_s:父本育种值 -
a_d:母本育种值
生物学本质:减数分裂过程中等位基因的随机分配,导致同胞间遗传组成差异("一龙生九子,九子各不同" 的遗传学解释)
关键特性:
-
期望值为 0(E (m_i)=0) -
方差为加性遗传方差的 1/4(Var (m_i)=σ_a²/4) -
仅存在于有性生殖过程中,无性繁殖(如克隆)时为 0
二、GBLUP 的核心原理
GBLUP(Genomic Best Linear Unbiased Prediction)是传统 BLUP 的基因组版本,核心创新是:
用基于 SNP 标记计算的 "实现亲缘关系矩阵"(G 矩阵)替代基于系谱的 "期望亲缘关系矩阵"(A 矩阵)
G 矩阵构建公式:
其中:
-
Z:个体 SNP 基因型矩阵(0,1,2 表示等位基因数量) -
p:对应 SNP 的等位基因频率
三、两者的内在联系
1. GBLUP 是捕捉孟德尔抽样误差的天然工具
核心关系:GBLUP 通过基因组标记直接追踪等位基因传递,从而能够估计传统 BLUP 无法捕捉的孟德尔抽样误差项
传统 BLUP 的局限:
-
A 矩阵只能表示 "期望" 的亲缘关系(如亲子 0.5,全同胞 0.5) -
无法反映同一亲本不同后代间因等位基因随机分配导致的实际遗传差异
GBLUP 的突破:
-
G 矩阵能捕获 "实际实现" 的亲缘关系,精确到染色体片段水平 -
直接反映个体间共享的等位基因状态,从而能够估计育种值中的孟德尔抽样部分(φ)
2. 数学表达:育种值的分解与估计
个体育种值可分解为:
传统 BLUP 估计:
GBLUP 估计:
其中 φ 是基于基因组信息对孟德尔抽样项的估计
四、GBLUP 如何提升孟德尔抽样误差的估计精度
1. 从 "期望" 到 "实现" 的亲缘关系
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
示例:
-
父母均为 Aa 的全同胞仔猪:理论上可能获得 AA、Aa 或 aa -
传统 BLUP 视它们为相同(亲缘系数 0.5) -
GBLUP 能区分:获得 AA 的仔猪育种值高于平均,获得 aa 的低于平均(通过 φ 项体现)
2. GBLUP 估计孟德尔抽样的机制
G 矩阵的本质:
-
计算的是个体间共享的等位基因状态,直接反映 "血缘同源" 程度 -
每个 SNP 都是一个微小的 "亲子鉴定器",累计所有 SNP 可精确评估遗传相似度
五、实际应用意义
1. 育种值估计精度提升
准确性对比:
-
传统 BLUP:准确率通常在 0.5-0.6 -
GBLUP:准确率提升至 0.7-0.8,尤其在以下情况显著: -
性状遗传力高 -
有大量标记覆盖全基因组 -
评估年轻个体(无后裔信息)
全同胞区分能力:
GBLUP 能在无表型数据时区分全同胞,为早期选择提供科学依据,这是传统 BLUP 完全无法实现的
2. 群体遗传管理优化
近交控制:
-
利用 GBLUP 估计的孟德尔抽样项,可优化选种策略,减少高亲缘配对 -
保持群体遗传多样性,降低近交衰退风险
遗传贡献预测:
孟德尔抽样项在截断选择中起关键作用,GBLUP 能更准确预测个体对未来世代的遗传贡献,优化育种规划
六、总结:关系的本质
GBLUP 与孟德尔抽样误差的关系可概括为:
GBLUP 是孟德尔抽样误差的 "解码器",而孟德尔抽样误差是 GBLUP 优于传统 BLUP 的 "核心密码"
本质联系:
-
孟德尔抽样误差是有性生殖中个体间遗传差异的根本来源 -
GBLUP 通过基因组标记直接追踪等位基因传递,能够捕获并量化这种差异 -
传统 BLUP 只能估计 "父母平均育种值" 部分,而 GBLUP 能同时估计 "父母平均育种值" 和 "孟德尔抽样误差" 两部分
实践价值:
GBLUP 对孟德尔抽样误差的捕捉能力,使其在育种值估计、早期选择、遗传多样性管理和近交控制等方面产生革命性突破,成为现代动植物育种的标准方法。
一句话总结:
GBLUP 之所以比传统 BLUP 更精准,正是因为它能够捕捉传统方法无法看见的孟德尔抽样误差,从而揭示个体间真实的遗传差异。之前写过一篇介绍孟德尔随机化的博客(孟德尔误差是个什么鬼?),由于解释得不太清楚,有点遗憾,今天更详细的解释了一通,了却心愿。
资源推荐:
6,飞哥的学习圈子

