我是在论文
The 1001G+ project: A curated collection of Arabidopsis thaliana long-read genome assemblies to advance plant research
中看到的这个工具
大规模测序应该还是有意义的(具体有啥意义还需要总结)
工具github主页
https://github.com/lh3/minipileup
用拟南芥的一号染色体数据做个测试
3个样本
seqkit grep -p Chr1 ../minimap2.syri/00.ref/at.col0.chr.fna -o 00.ref/col0.chr1.fa
seqkit grep -p Chr1 ../minimap2.syri/00.qrys/An1.fa -o 00.ref/An1.chr1.fa
seqkit grep -p Chr1 ../minimap2.syri/00.qrys/C24.fa -o 00.ref/C24.chr1.fa
seqkit grep -p Chr1 ../minimap2.syri/00.qrys/Kyo.fa -o 00.ref/Kyo.chr1.fa
minimap2比对
minimap2 -ax asm5 00.ref/col0.chr1.fa 00.ref/An1.chr1.fa -t 8 | samtools sort -@ 8 -O BAM -o 02.bam/An1.sorted.bam
minimap2 -ax asm5 00.ref/col0.chr1.fa 00.ref/C24.chr1.fa -t 8 | samtools sort -@ 8 -O BAM -o 02.bam/C24.sorted.bam
minimap2 -ax asm5 00.ref/col0.chr1.fa 00.ref/Kyo.chr1.fa -t 8 | samtools sort -@ 8 -O BAM -o 02.bam/Kyo.sorted.bam
samtools index 02.bam/An1.sorted.bam
samtools index 02.bam/C24.sorted.bam
samtools index 02.bam/Kyo.sorted.bam
检测变异
time ~/biotools/minipileup-master/minipileup -f 00.ref/col0.chr1.fa -vcC -s0 -a0 -q0 -l 20000 02.bam/An1.sorted.bam 02.bam/C24.sorted.bam 02.bam/Kyo.sorted.bam > var.vcf
速度非常快
输出文件
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

