問題タブ [bam]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pysam.view() を使用して SAM を BAM に変換する方法
pysamライブラリを使用して SAM ファイルを BAM に変換したいと考えています。私は samtools からこのコマンドを書き込もうとしています:
次のようなPythonコードとして:
このドキュメントによると。しかし、残念ながらうまくいきません。どうすればいいですか?前に空の BAM ファイルを作成する必要がありますか、それとも自動的に作成されますか? 最後に、私はこのエラーがあります:
SamtoolsError: 'samtools がエラー 1 で返されました: stdout=b'\x1f\x8b\x08\x04\x00\x00\x00\x00\x00\xff\x06\x00BC\x02\x004\x01\x9dQMO\x83@\x10 \xa5G\xfa#\xccz\xb3\x87\xfd\xa2\xa0\x86\x83\xa9\xad\xd86i\t\x16\xc3u\xb3P\xc0&,PvcC\xff\xa6\x7f\xc8\xc5\ x88&\xe8\xc1xx\x99\xc9\xbcyy\x937\xf3\xfb\xed\xe8md\x18\xb3\xf0\xc9\x0c}\xd7"\x90\x90)a\xa1\xc5\xe8.\xcdX \xd2&\x8cPv\xb9\xf2"\xb8\x8av\xac\xac\xd6\xa5L\x1ben\xf4\xee\xed\xf5x\x16,\xcd\xf5\x83\x1b\x9f\xb8\x19\xf8 \x1f%\xf2]\x82n\x10u`C\xa9M\xcc\xc5\xa6\x1b\x03\x91\n\x00\x95E\x00\x9c[\x00>;\x00\xcb\xa4\xe1* y\xc1\xbcP\x82\x97e\x8c\xfde\xc8\x1e\x97\xd4\xc1\xbd\x99\x97W\r\x1e\\\x84\x89\xcd\x9a\x94\xef%\x13 \xbc\xae\xd3=\xde\xf2z\xd1&\x84~5l\xa0@\x19\x97\x8a\xff\xdfo\xfa\xe9\x97\x1dJ^\x0ci\x16z(;\xa2\xfc\ xdc\'!\xb9PUU\xc8.\x8e\xef>\xe8\xa3\xa1\x88\x12pU\xb7\x9a\x9at\xd1\xf4+\xe0\xf5\x90\x9e\x00\x0c\x01\x8c\x01\xac\x00V\xa2\xee\x10g\xb6 <\xe6\x9a\xfei\x1bxH\x8b\xc1\xdd\xefT\xcc\xc5X\x7f\xd5\x98h\xfc\xf5\xa7\xc6\x85V\xbc\x03\xb7nn4\x10\x02\x00\ x00\x1f\x8b\x08\x04\x00\x00\x00\x00\x00\xff\x06\x00BC\x02\x00\x1b\x00\x03\x00\x00\x00\x00\x00\x00\x00\ x00\x00', stderr=[main_samview] ランダム アラインメントの取得は、インデックス付きの BAM または CRAM ファイルに対してのみ機能します。\n'
前もって感謝します!
r - BAM ファイルから読み取り名と特定の位置に関連するヌクレオチドを抽出する (R)
BAM ファイルと、この配置でより詳しく調べたいいくつかの位置があるとします。私の目標は、これらの位置が同じリード上にあるかどうか、および各リードがこれら 2 つの位置にどのヌクレオチドを持っているかを調べることです。したがって、私の出力は、その位置で発生するすべての読み取りのテーブルであり、関連するヌクレオチドがリストされているはずです。
出力は次のようになります (最初の 3 つの位置は 980、1350、1400 です。読み取り名は私が作成しました)。
名前を読む | 980 | 1350 | 1400 | ... |
---|---|---|---|---|
ReAdN4m1L03 | あ | T | ... | |
ReAdN4m2L02 | あ | T | G | ... |
ReAdN4m3L01 | T | G | ... | |
... | ... | ... | ... | ... |
最後に、読み取りを介してヌクレオチドをリンクするテーブルが必要です。
これまでのところ、目的の位置で Bam ファイルを読み込もうとしました。
次のコードで読み取りにアクセスできますが、個々の位置で対応するヌクレオチドを取得するにはどうすればよいですか?
aln[[i]]$cigar
手動でヌクレオチドを抽出するために、配列を使用して CIGAR 文字列を操作しようとしましたaln[[i]]$seq
が、それはますます多くの問題につながりました。
ヌクレオチドを抽出する簡単な方法はありますか?
私は長い間インターネットで簡単な解決策を探してきましたが、成功しませんでした。うまくいけば、誰かがここで私を助けてくれるでしょう! 事前にお時間をいただきありがとうございます。
python - Python と Ubuntu の parseargs を使用した BAM ファイル処理関数コード
コードを調整して、bam ファイル内の特定の要素の情報を抽出しようとしています。
これが私がこれまでに持っているものです:
私が得るエラーは次のとおりです。
ValueError: Length mismatch: Expected axis has 1 elements, new values have 3 elements
これは、関数のグローバル変数で必要なファイルを作成した後です。以前、私が得ていたエラーは次のとおりです。
TypeError: count_bam() missing 3 required positional arguments: 'bed_file', 'output', and 'genome_sizes'
これはargparseと関係があると思います。最初の必須引数 (bamfile) を読み取りますが、他の 3 つは登録しません。
どんな助けでも大歓迎です。