A <- rnorm(1000,0,1)outlier_above <- which(A > mean(A) + 3*sd(A))outlier_below <- which(A < mean(A) - 3*sd(A))del_id = c(outlier_above,outlier_below)
plink --file test --het
第一列:家系ID
第二列:个体ID
第三列:观测的纯合位点数
第四列:期望的纯合位点数
第五列:总个体数
第六列:F值(越小,说明杂合度越高)
纯系群体,做GWAS分析,可以对杂合度进行质控,比如小于0.3的认为是杂合群体,可以删除。
自然群体,做GWAS分析,可以对杂合度进行质控,认为群体的杂合度应该是合理区间,可以用三倍标准差的形式进行离群样本的质控,比如计算的F值,通过上面提供的函数,剔除样本。

