bcftools を使用して 3000 個のバクテリア bcf ファイルをマージしようとしています。vcf ファイルは GATK を使用して生成され、bcf に変換され、bcftools によって索引付けされています。bcftools はデータの 20% の分析に進みますが、途中で終了し続け、バリアントの一部 (2M バクテリア ゲノムから最大 500kb) に対してのみマージされた bcf ファイルを生成します。私が使用しているコードは次のようなものです:
bcftools1.7/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF
出力エラーは次のとおりです。
/bin/sh: line 1: 17041 Segmentation fault (core dumped) bcftools/bcftools merge -l VarList.txt -0 --missing-to-ref --threads 1 -O b > CombinedVCF
以前は、同じコマンドを 400 サンプルに対して問題なく実行しました。
オンラインで検索すると、「変数への参照がその変数が存在するセグメントの外にある場合、または読み取り専用セグメントにある場所に書き込みが試行された場合にセグメンテーション違反が発生します」。コマンドは、特定のジョブに使用可能な 80Gb の RAM を備えたクラスターで実行されています。このエラーが bcftools ソフトウェア自体の問題によるものなのか、それともコマンドを実行しているシステムの制限によるものなのか、よくわかりません。
エラーを再現するサンプル bcf ファイルを次に示します ( https://figshare.com/articles/BCF_file_segfault/7412864 )。エラーはサンプル サイズが大きい場合にのみ表示されるため、これ以上サイズを小さくすることはできませんでした。