昨天用cactus 2.1.1版本把示例数据的流程跑通了,然后测试了一下真实数据,遇到了报错
Genome::getChild() - child out of range
https://github.com/ComparativeGenomicsToolkit/hal/issues/241
这个问题里他自己解决了,我的目前还不知道怎么办,这一步是hal2vg这个程序的问题
今天用跑示例数据,示例数据也遇到了这个报错,搞不懂是怎么回事,重新又安装了 cactus 2.2.3
https://github.com/ComparativeGenomicsToolkit/cactus/issues/808
把示例数据跑通了,不知道测试自己的真实数据是否会有问题,先记录一下示例数据的代码
先准备一个配置文件
第一列是一个代号,第二列是基因组的文件路径,空格分割
把软件的bin目录添加到环境变量
cactus-minigraph ./js01 seq.txt primates.gfa.gz --reference A
cactus-graphmap ./js02 seq.txt primates.gfa.gz primates.paf --reference A --outputFasta primates.gfa.fa.gz
cactus-align ./js03 seq.txt primates.paf primates.hal --pangenome --outVG --reference A
cactus-graphmap-join ./js04 --vg primates.vg --outDir ./ --outName primates-pg --reference A --vcf --giraffe --gfaffix --wlineSep "."
中国人泛基因组的那篇Nature论文里是先单独跑minigraph,没有用第一步的 cactus-minigraph,测试一下这样是否能行
minigraph -cxggs -t 8 ../01.input/simChimp.chr6 ../01.input/simGorilla.chr6 ../01.input/simHuman.chr6 ../01.input/simOrang.chr6 -o minigraph.gfa
cactus-graphmap ./js02 ../seq.txt minigraph.gfa primates.paf --reference A --outputFasta primates.gfa.fa.gz
cactus-align ./js03 ../seq.txt primates.paf primates.hal --pangenome --outVG --reference A
cactus-graphmap-join ./js04 --vg primates.vg --outDir ./ --outName primates-pg --reference A --vcf --giraffe --gfaffix --wlineSep "."
这个也能行的通,不知道用自己真实数据能否顺利跑通流程
欢迎大家关注我的公众号
小明的数据分析笔记本
小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

