問題タブ [blast]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - ファイルから(多くの)値を取得して、xmlstarletを使用して大きなxmlをフィルタリングする方法はありますか?
みんな。<Interaction>
ファイルから定義した値のリストによって定義されたいくつかのノードのみを保持するために、(BLAST から) 大きな xml ファイルをフィルター処理しようとして<Iteration_iter-num>
います。簡単な例を次に示します (実際の Blast.xml には 80000 回を超える繰り返しがあります)。
そして、保持する反復を含むファイルがあります(keep_iterとして保存されます):
この種の低規模の問題については、xmlstarlet を使用してフィルタリングを実行し、最初に比較用の文字列を格納するファイルのバージョンを作成しました (フィルターとして保存されます)。
これは、以下のチャームとして機能します。
基本的に、フィルタ ファイルに含まれていないすべての反復ノードを削除しました。
問題は、フィルターする 20000 の値を持つ keep_iter ファイルが実際にあることです。フィルタ ファイルを作成して上記の xmlstarlet コマンドを実行すると、明らかに引数が長すぎます。
このような Blast.xml ファイルをフィルタリングして、keep_iter ファイルにリストされている反復番号 (20k の値) の反復ノードのみを保持するための提案はありますか? 元のxml構造を維持したい。
apache - Web Blast Apache 構成 (エラー 403)
Easy PHP Dev Server 13.1 (Apache 2.2、Windows 7) を介してローカルで Web Blast 2.2.28+ を実行しようとしていますが、検索をクリックすると、サイト内で開くとエラー 403 が表示されるか、次のメッセージが表示されます ( blast.cgi コンテンツ)、blast.html ページを直接使用する場合:
Apache は「C:\Program Files (x86)\EasyPHP-DevServer-13.1VC9\binaries\apache\bin」にインストールされ、次のように構成されています (httpd.conf):
blast.html ファイルは「C:\Program Files (x86)\EasyPHP-DevServer-13.1VC9\data\localweb\original\cgi-bin」にあります。
私が見つけたApacheアクセスログで:
およびApacheエラーログで:
Apache のことはちょっとよくわかりませんが、 httpd.conf で ExecCGI を有効にしていませんか? 私はとても混乱しています。
想像できるすべての組み合わせ(パス、ファイル名、Apacheオプションシーケンスの変更)を試しましたが...何もありません。
誰か助けてくれませんか?どうしても必要なので、2012 年から実行しようとしてきました。
皆さんありがとうございました。言語の問題については申し訳ありません =)。ディミトリウス
python - ファイルを行ごとに処理する
大きな FASTA ファイルと一緒に大きな BLAST ファイルを処理していますが、BLAST の 1 ブロック (1 行としましょう) に対して複数行の FASTA をロードする必要があります。
BLAST の 2 番目のループ (行) では、最後に処理された FASTA 行から次の行に続くと予想されますが、同じ FASTA 行をすべてロードしています。なんで?そして、どうすれば次の行をロードできますか? インデックスを追加する必要は本当にありますか?
FASTA の典型的な形式は次のとおりです。
次の BLAST シーケンスのすべての行に各シーケンスが必要です。
python - Biopython を使用して複数のシーケンスを BLAST にアップロードするにはどうすればよいですか?
単一の FASTA ファイルから複数の配列の BLASTN 検索を実行しようとしています。ファイルから単一のシーケンスを簡単にクエリできますが、1 つのファイル内のすべてのシーケンスをクエリするのに苦労しています。これらは比較的短い読み取りであるため、ファイルを個々のシーケンスに分割して、それぞれを個別にクエリすることは避けたいと思います。
これは私がこれまでに試したことです:
誰にもアイデアはありますか?
perl - Perl の system() が「一時停止」しました。$ARGV[]が原因?
BLAST コマンドを perl スクリプトに結合するときに行き詰まりました。問題は、PART II の開始時にコマンド ラインが一時停止することです。
パート I は、fasta シーケンスをトリミングするために使用されます。PART II は、PART I で生成されたファイルを使用して BLAST を実行するために使用されます。2 つの部分はどちらも個別に実行できますが、組み合わせると「一時停止」の問題が発生します。
パート I で生成された $ARGV[1] と $ARGV[3] がパート II で使用できないためだと思います。いろいろ試したのに直し方がわからない。
ありがとう!
perl - ブラスト結果から最良のブラスト遺伝子株を選択するためのperlスクリプト
ブラスト出力を含む巨大なファイルがあり、クエリ ID、サブジェクト gi、およびフレーム (基本的には行全体) を選択する必要があり、e 値が最も低く、重複行を省略します (他のより高い e 値を持つ他のすべての行を省略します)。ファイルは次のようになります。
この場合の予想される出力は、e_value が最も小さい次の 2 行のみである必要があります。
コードを作成しましたが、動作していないようです。この問題を解決するために私を助けてください。お時間とご協力をいただければ幸いです。これは私がこれまでに持っているものです:
xml - 1回のヒットで複数のHSPが発生するのはどういう意味ですか?
私はバイオインフォマティクスの分野に不慣れです。BLAST xml 出力ファイルを見ていて、各ブラスト ヒットの下に複数の HSP がある理由を理解しようとしていました。HSP が High-Scoring Segment Pair の略であることは知っていますが、複数の HSP が 1 つのヒットに割り当てられる方法と理由がよくわかりません。