問題タブ [bcftools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bioinformatics - PLink を使用して重複した SNP を削除するにはどうすればよいですか?
私はPLINKと協力してゲノムワイドなデータを解析しています。
重複した SNP を削除する方法を知っている人はいますか?
makefile - Makefile - samtools のインストールに失敗しました
openSUSE に samtools をインストールしようとしています。
うまくいきました。
うまくいきました。
samtools の場合:
次の出力が生成されます。
これがうまくいかない理由がわかりません。make ツールの使い方は知っていますが、linuxOS の初心者です。
perl - Linkdatagen のエラー: 連結 (.) または文字列での初期化されていない値 $chr の使用
こんにちは、perl ベースのツールである linkdatagen を使用しようとしていました。vcf ファイル (SAMtools の mpileup を使用) と hapmap 注釈ファイル (付属) が必要です。指示に従いましたが、提供された perl スクリプトを使用すると、このエラーが発生します。私が使用したコードは次のとおりです。
Use of uninitiated value $chr in concatenation (.) or string at vcf2linkdatagentest.pl line 487, <IN> line 1
.... それは延々と続く.. 私は著者にメールを送りましたが、まだ連絡がありません。ここで誰か助けてくれませんか?私は何を間違っていますか?
Perl スクリプトは次のとおりです。 http://bioinf.wehi.edu.au/software/linkdatagen/vcf2linkdatagen.pl
HapMap ファイルは、以下の Web サイトからダウンロードできます。
http://bioinf.wehi.edu.au/software/linkdatagen/
本当にありがとう
bash - スクリプトではなくプロンプトで機能するコマンド ライン
これが正確なコマンドです
シェルで直接実行すると、正常に動作します。
それをbashスクリプトに入れると失敗します
エラーメッセージはbcftools自体から来ています
[メイン] 認識できないコマンドです。
スクリプトは ascii でエンコードされています。
そのため、bcftools は、スクリプト内ではなくプロンプトから直接受け取った引数を受け入れます。プロンプトからのスペースとスクリプトからのスペースが同じように解釈されないようです
unix - UNIXの列でIDを一致させる方法は?
同様の質問が投稿されている可能性があることは承知していますが、検索したところ、質問の詳細が異なるようです (または、少なくとも私の場合に採用できる解決策を見つけることができませんでした)。
現在、 「messyFile」と「wantedID 」の 2 つのファイルがあります。「messyFile」のサイズは80,000,000 X 2,500ですが、「wantedID」のサイズは1 x 462です。"messyFile"の 253 行目には、2500 個の ID があります。ただし、必要なのは、ファイル"wantedID"内の 462 個の ID だけです。462 ID が 2500 ID のサブセットであると仮定すると、ファイル「messyFile」を処理して、462 ID に関する情報 (つまり、サイズ80,000,000 X 462 ) のみが含まれるようにするにはどうすればよいでしょうか。
大変お待たせいたしました!
ps: 混乱させてすみません。しかし、ええ、質問はこのようなものに要約できます。"File#1"の 1 行目には、10 個の ID があります。"File#2"の 1 行目には 3 つの ID があります ( "File#2"は 1 行のみで構成されています)。3 つの ID は、10 の ID のサブセットです。ここで、 「File#2」に記載されている 3 つの ID に関する情報のみが含まれるように、「File#1」を処理したいと考えています。
ps2: 「messyFile」は vcf ファイルですが、「wantedID」はテキスト ファイルにすることができます (小さいので「できる」と言ったので、ほぼすべてのタイプを作成できます)。
ps3: "File#1" は次のようになります。
「File#2」は次のようになります。
目的の出力は次のようになります。
segmentation-fault - bcftools でのセグメンテーション違反エラーの修正
bcftools を使用して 3000 個のバクテリア bcf ファイルをマージしようとしています。vcf ファイルは GATK を使用して生成され、bcf に変換され、bcftools によって索引付けされています。bcftools はデータの 20% の分析に進みますが、途中で終了し続け、バリアントの一部 (2M バクテリア ゲノムから最大 500kb) に対してのみマージされた bcf ファイルを生成します。私が使用しているコードは次のようなものです:
出力エラーは次のとおりです。
以前は、同じコマンドを 400 サンプルに対して問題なく実行しました。
オンラインで検索すると、「変数への参照がその変数が存在するセグメントの外にある場合、または読み取り専用セグメントにある場所に書き込みが試行された場合にセグメンテーション違反が発生します」。コマンドは、特定のジョブに使用可能な 80Gb の RAM を備えたクラスターで実行されています。このエラーが bcftools ソフトウェア自体の問題によるものなのか、それともコマンドを実行しているシステムの制限によるものなのか、よくわかりません。
エラーを再現するサンプル bcf ファイルを次に示します ( https://figshare.com/articles/BCF_file_segfault/7412864 )。エラーはサンプル サイズが大きい場合にのみ表示されるため、これ以上サイズを小さくすることはできませんでした。