問題タブ [samtools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
qsub - qsub からの samtools の実行
qsub 呼び出しからいくつかの samtools コマンドを実行しようとしています (クラスターで実行するため)。何らかの理由で、コマンドが認識されないようです。ただし、コマンドをコピーして貼り付け、ターミナル クラスターから直接実行すると、正常に動作します。誰かがそのような問題を経験したことがありますか、または私が間違っていることを知っていますか? ありがとう、
パトリック
私のqsub(これは機能しません):
ターミナルから直接コマンドを実行すると、次のように動作します。
samtools index /data/test.bam /data/test.bai
python - Python で 2 つのサブプロセスの stdout を結合し、新しいサブプロセスの stdin にパイプする方法
シェルから次のコマンドを実行したとしましょう
samtools ビューに慣れていない方向け (これは stackoverflow であるため)。これが本質的に行っていることは、新しいヘッダーを持つ新しいbamファイルを作成することです. 通常、bam ファイルは大きな圧縮ファイルであるため、場合によってはファイルを通過するだけでも時間がかかることがあります。別の方法の 1 つは、command2 を実行してから、samtools reheader を使用してヘッダーを切り替えることです。これは、大きなファイルを 2 回通過します。上記のコマンドは、bam を 1 回通過します。これは、大きな bam ファイルに適しています (圧縮されている場合でも 20GB を超えます - WGS)。
私の質問は、サブプロセスを使用して Python でこのタイプのコマンドを実装する方法です。
私は次のものを持っています:
どんな助けでも大歓迎です。ありがとう。
python - pysam モジュールのインポートでエラーが発生する
このエラーの原因を特定するのに苦労しています。
anaconda をインストールして conda install pysam を使用し、少しは機能しましたが、突然このエラーが発生しました
ファイル内を調べたところ、対応するコードは次のとおりです
これを引き起こしている原因について何か考えはありますか???
python - 文字列内で指定された長さの単語に一致する正規表現
samtools mpileup からのテキスト出力を解析しようとしています。文字列から始めます
a の+
後に整数が続く場合は常にn
、その整数に続く n 文字を選択し、全体を で置き換えたいと思います*
。したがって、このテストケースでは、
私は正規表現を持ってい \+[0-9]+[ACGTNacgtn]+
ますが、その結果、出力が発生.$......*.*.*
し、末尾の G も失われます。n が事前に知られていないが、文字列自体で指定されている n 文字を選択するにはどうすればよいですか?
bioinformatics - バイオインフォマティクスでは、シングルトンとは何ですか?
バイオインフォマティクスは、用語が明確に定義されていて、簡単にアクセスできる主題ではないことにすぐに気付きました。私の結果のいくつかとは明らかな食い違いがあります。
samtools view -b -h -f 8 fileName.bam > mateUnmapped.bam
いくつかの BAM ファイルで使用しました。このコマンドは、パートナーがドラフトゲノムと一致しない読み取りのみを抽出するという印象を受けています (ヘッダーも含まれます。出力は BAM 形式です)。
結果のファイルでを使用するsamtools 'flagstat'
と、興味深い結果が得られます。「シングルトン」の数が読み取りの総数と一致しません...これは奇妙に思えます。
私が見つけることができる唯一の和解はここにあります:
http://seqanswers.com/forums/showthread.php?t=46711
このフォーラムで提起された質問に回答したある人は、シングルトンはパートナーをまったく読み取らないシーケンスとして定義されることがあると主張しています。しかし、それはまだ私の結果を説明していません。Flagstat によると、私の読み取りの約 40% はシングルトンですが、私が使用した「view」コマンドに基づくと、それらはすべてシングルトンである必要があります。
ベテランのバイオインフォマティシャンが私を助けてくれますか?
java - htsjdk 断続的なインデックス付き fasta 読み取りエラー
htsjdk.samtools.reference.IndexedFastaSequenceFile から断続的に例外が発生するという問題があります。
htsjdk.samtools.SAMException: シーケンス ディクショナリとインデックスに異なる数のコンティグが含まれているか、htsjdk.samtools.SAMException: 取得できません ...
問題は、同じコードを何度も呼び出していて、このエラーが断続的にしか発生しないことです。
特にシーケンス辞書の応答の場合、エラーメッセージは実際には誤解を招くものであると私は提案します。
java - jython または groovy から htsjdk で定義されたクラスを使用する
ここから htsjdk.jar によって提供されるメソッドにアクセスしようとしています: https://samtools.github.io/htsjdk/
ここに文書化されています: https://samtools.github.io/htsjdk/javadoc/htsjdk/index.html
ジソンを使用。バイナリ BAM ファイルの開始位置と終了位置を取得するには、BAM ファイル インデックス (BAI ファイル) にアクセス/クエリする方法が必要です。テスト BAM および BAI ファイルは、 https ://github.com/samtools/htsjdk/tree/master/testdata/htsjdk/samtools/BAMFileIndexTest から取得できます 。
Jython レジストリに配置した後の jython 2.7.0:
bai_foo.getNumberOfReferences() などのいくつかのメソッドにアクセスできますが、目的のメソッド
getBinsOverlapping(int referenceIndex, int startPos, int endPos) は BrowseableBAMIndex インターフェイスにあります。
しかし、Jython で Java クラスをサブクラス化することになると、私は迷ってしまいます。このタスクは、特定のゲノム位置に対応する BAM ファイル チャンクのリストを取得することです。テスト BAM/BAI ファイル、つまり chrM 10000-15000 (染色体、start_pos、end_pos) の場合、htsjdk の代わりに市販の samtools スタンドアロン プログラムを使用して、11 のマッピングされた読み取りを取得します。
助けてくれて本当にありがとうございます
ダレク
編集: Groovy部分を再Groovyバージョン:2.4.4
上記のコードは groovy で動作します。私の問題は、このコードが機能しないことではなく、BAI ファイル形式を扱う Java クラスからメソッドにアクセスする適切な方法がわからないことです。htsjdk/src/java/htsjdk/samtools/*java ファイル (repo@github からの git clone) で AbstractBAMFileIndex を検索しましたが、何をする必要があるかはまだ明確ではありません。
makefile - Makefile - samtools のインストールに失敗しました
openSUSE に samtools をインストールしようとしています。
うまくいきました。
うまくいきました。
samtools の場合:
次の出力が生成されます。
これがうまくいかない理由がわかりません。make ツールの使い方は知っていますが、linuxOS の初心者です。