問題タブ [biopython]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - BLAST 結果の上位 10 シーケンスを取得する Bio Python
BLAST 結果の上位 10 シーケンスを取得したい (シーケンスのみ、アライメント、スコア、e 値などなし)。5 つの fasta ファイルを含むテキスト ファイルを入力しています。したがって、出力は各 fasta ファイルの上位 10 件のブラスト ヒットになるはずです。したがって、出力ファイルには 50 のシーケンスが含まれます。
Bio.SeqIO を介して各入力 fasta ファイルを読み取り、temp.faa として書き込み、サブプロセスを介してコマンドライン BLAST に次のように渡します。
出力には他にも多くの情報があります。この出力を今解析する必要がありますか、それとももっと良い方法があります。
ありがとう
PS XML は 1 つの方法かもしれませんが、関連する NCBIXML パーサー構文が見つかりませんでした。
python - Biopython が Window 7 64 で動作しない (インポート bio 関数が動作しない)
「バイオのインポート」が機能しないため、biopython の使用に問題があります。
Piston、Django、および NumPy サイト パッケージがインストールされた Python 2.7.1 を使用した Window 7 の 64 ビット システムがあり、それらはすべてインポート機能で正常に動作します。
何か案は?
bioinformatics - Biopython でギャップのあるアラインメントを持つ PWM
Clustalw の複数の配列アラインメントから Biopython で位置加重行列 (PWM) を生成しようとしています。ギャップのあるアラインメントで行うたびに、「間違ったアルファベット」エラーが発生します。ドキュメントを読むと、ギャップのあるアラインメントの「-」文字を処理するには、ギャップのあるアルファベットを利用する必要があると思います。しかし、これを行ってもエラーは解決しません。誰かがこのコードの問題を見ていますか、またはギャップのあるClustalアライメントからPWMを生成するより良い方法を持っていますか?
python - Cygwin で PYTHONPATH を設定するにはどうすればよいですか?
Biopython のインストール手順では、Biopython が機能しない場合は、次のようにする必要があると記載されています。
export PYTHONPATH = $PYTHONPATH':/directory/where/you/put/Biopython'
Cygwin で ~ ディレクトリから Biopython ディレクトリ (または ~ ディレクトリ以降のすべて) の名前を使用してそれを実行しようとしましたが、Python インタープリターに移動して入力してテストしたとき
From Bio.Seq import Seq
モジュールが存在しないと言われました。
Seq をインポートできるようにするために Biopython ディレクトリにいる必要がないようにするにはどうすればよいですか?
python - シーケンスの比較エラー-数値として解釈される文字列
前の質問と同じようなことをしようとしています。
私の目的は、等しいすべてのシーケンスを結合することです。でも今回は文字の代わりに数字があります。
アラインメントファイルはここにあります-phylipファイル
問題は、私がこれを行おうとしたときです。
このエラーが発生します:
これが私が作成している2番目のファイルであり、最初のファイルが完全に機能したため、理由がわかりません。
以下は、アライメントファイルの作成に使用されるコードです。
したがって、1001000000100000100000001000000000000000は文字列であるため、数値として解釈されるべきではありません。
何か案は?
ありがとうございました!
python - Pythonスクリプトの問題
Python スクリプトを実行しようとしていますが、表示されるエラーは次のとおりです。
誰でも私を助けることができますか?
python - BLAST出力からギャップのないシーケンスを取得するには?
FASTA 形式の BLAST 出力からギャップのないシーケンスを取得することに興味があります。使えると思っhsps_no_gap
たけどダメ。これを行うために使用できる方法はありますか?
python - biopython を使用した Fasta ファイル記述の解析
長い説明を含む fasta ファイル (最初のシーケンスは後述) があります。特定の説明フィールドを選択する必要があります。次のコードを使用したとき; 説明全体が文字列になります。
説明フィールドを (biopython ライブラリを使用して) 配列に取得し、説明を文字列に取り込んで文字列を吐き出さずに特定のフィールドを選択する簡単な方法はありますか?
コード出力
fasta ファイルのシーケンスの 1 つ。
biopython - Bio.SeqIO.index によって作成された 2 つ以上の辞書を結合するにはどうすればよいですか?
「indata」と「pairdata」に格納された2つの「辞書」を結合できるようにしたいのですが、このコード、
次のエラーが発生します。
使ってみましたが、
これは機能しますが、結果として得られる辞書は、私が持っている infile と pairfile のサイズに対して実用的であるにはあまりにも多くのメモリを消費します。
私が検討した最後のオプションは次のとおりです。
これは完全に機能しますが、非常に遅いです。上記の最初の例から2つのインデックスを正常に結合する方法/かどうかを知っている人はいますか?
python - IOErrorを解決する方法:[Errno 2]そのようなファイルまたはディレクトリはありません:Biopythonにありますか?
次のコードを使用してBiopythonでfastaファイルを解析しようとしています。このエラーを解決するにはどうすればよいですか?
上記のエラーが発生します。しかし、私のファイルはすでにそこにあります。私はwindows7OS、python 2.7、Biopython1.57を使用しています。何か提案をお願いします。