大数跨境
0
0

Minigraph-Cactus构建泛基因组的一个简单实例

Minigraph-Cactus构建泛基因组的一个简单实例 小明的数据分析笔记本
2025-05-02
2

昨天用cactus 2.1.1版本把示例数据的流程跑通了,然后测试了一下真实数据,遇到了报错

Genome::getChild() - child out of range

https://github.com/ComparativeGenomicsToolkit/hal/issues/241

这个问题里他自己解决了,我的目前还不知道怎么办,这一步是hal2vg这个程序的问题

今天用跑示例数据,示例数据也遇到了这个报错,搞不懂是怎么回事,重新又安装了 cactus 2.2.3

https://github.com/ComparativeGenomicsToolkit/cactus/issues/808

把示例数据跑通了,不知道测试自己的真实数据是否会有问题,先记录一下示例数据的代码

先准备一个配置文件

第一列是一个代号,第二列是基因组的文件路径,空格分割

把软件的bin目录添加到环境变量

cactus-minigraph ./js01 seq.txt primates.gfa.gz --reference A
cactus-graphmap ./js02 seq.txt primates.gfa.gz primates.paf --reference A --outputFasta primates.gfa.fa.gz
cactus-align ./js03 seq.txt primates.paf primates.hal --pangenome --outVG --reference A
cactus-graphmap-join ./js04 --vg primates.vg --outDir ./ --outName primates-pg --reference A --vcf --giraffe --gfaffix --wlineSep "."

中国人泛基因组的那篇Nature论文里是先单独跑minigraph,没有用第一步的 cactus-minigraph,测试一下这样是否能行

minigraph -cxggs -t 8 ../01.input/simChimp.chr6 ../01.input/simGorilla.chr6 ../01.input/simHuman.chr6 ../01.input/simOrang.chr6 -o minigraph.gfa
cactus-graphmap ./js02 ../seq.txt minigraph.gfa primates.paf --reference A --outputFasta primates.gfa.fa.gz
cactus-align ./js03 ../seq.txt primates.paf primates.hal --pangenome --outVG --reference A
cactus-graphmap-join ./js04 --vg primates.vg --outDir ./ --outName primates-pg --reference A --vcf --giraffe --gfaffix --wlineSep "."

这个也能行的通,不知道用自己真实数据能否顺利跑通流程


欢迎大家关注我的公众号

小明的数据分析笔记本


小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!


【声明】内容源于网络
0
0
小明的数据分析笔记本
分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子;偶尔会分享一些组学数据处理相关的内容
内容 971
粉丝 0
小明的数据分析笔记本 分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子;偶尔会分享一些组学数据处理相关的内容
总阅读437
粉丝0
内容971