問題タブ [picard]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java で BAM ファイル形式からコンセンサス配列を取得する方法 (Picard を使用)
Java を使用して Picard BAM ファイル形式を表示するにはどうすればよいですか?
bioinformatics - Picard SamToFastqは、読み取りを1つだけ抽出し、エラーをスローします
bamファイルからFastQファイルを抽出しようとしています。Picardは、このツールのドキュメントでbamまたはsamファイルのいずれかを受け入れると述べているように、SamToFastqを使用してこれを行うことができます。
しかし、実行すると、読み取りが1つだけ抽出され、終了します。これがエラーメッセージです。どんな助けでも大歓迎です。
java - hs37d5 fastq ファイルの解凍時に発生する末尾のガベージの処理方法
私は本当にこの問題を解決しようとしましたが、これまで誰もこの問題に直面していなかったようです. 1000G から fastq ファイルを解凍しました。
ただし、解凍されたフォルダーには「末尾のゴミ」があり、次のエラーが発生します。
「スレッド「メイン」の例外 picard.PicardException: シーケンス名が参照に複数回表示されます: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
実行しようとすると:
誰かが私に少し助けを与えることができれば、それは大歓迎です.
bioinformatics - picard markduplicate は PCR 重複 samflag を切り替えますか
私は RNA-seq bam ファイルを持っていますが、私を困惑させる読み取りはほとんどありません。
bam ヘッダーによると、この bam ファイルは座標でソートされ、tophat を使用して作成され、markduplicate ステップは実行されていません。ただし、一部の読み取りは、samflag で重複しているとマークされています。さらに悪いことに、picard markduplicate を実行すると、これらの読み取りの pcr 重複フラグが切り替えられ、重複していないことが示されます。また、この読み取りの複製 (同じ開始位置と一致する開始位置を持つ同一の読み取り) を手動で見つけたので、最初のマーキングは真実に見えます。
だから私の質問は次のとおり
です。なぜこれが起こるのでしょうか?
Tophat は、重複している読み取りをマークしますか? (私はそうは思いません)
そして、読み取りが既に重複しているとマークされている場合、picard markduplicate はトグルしますか?
マーク重複ステップの前後で読み取りがどのように見えるかを次に示します。
Before:
C0RTF 1187 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
After Markduplicate
C0RTF 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC...
ありがとう