問題タブ [pairwise]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
70 参照

r - ペアごとのバイナリ比較 - R でのコードの最適化

細菌モデルの遺伝子構造を表すファイルがあります。各行はモデルを表します。行は、遺伝子が存在する固定長のバイナリ文字列です (存在する場合は 1、存在しない場合は 0)。私の仕事は、モデルの各ペアの遺伝子配列を比較し、それらがどの程度類似しているかのスコアを取得し、非類似度マトリックスを計算することです。

1 つのファイルに合計 450 のモデル (行) があり、250 のファイルがあります。私は動作するコードを持っていますが、たった 1 つのファイルに対してすべてを実行するには、約 1.6 時間かかります。

私のコードは何をしますか:

  1. ファイルを読み取ります
  2. バイナリ文字列をデータ フレームに変換 Gene、Model_1、Model_2、Model_3、… Model_450
  3. ネストされた for ループを実行して、ペアごとの比較 (マトリックスの上半分のみ) を実行します。対応する 2 つの列を取得して追加し、合計が 2 になる位置を数えます (両方のモデルに存在することを意味します)。
  4. データをファイルに書き込む
  5. 後でマトリックスを作成する

比較コード

マトリックスへの変換

プロセスを高速化する方法はありますか? 比較を行うより効率的な方法はありますか?

0 投票する
1 に答える
107 参照

python - biopython で pairwise2 を使用して一致した残基のインデックス

pairwise2Pythonを使用して、文字列に一致する残基のインデックスを知りたいと思っています。

たとえば、2つの文字列があります

次のコードを使用します。

私が得るアライメントの1つは次のとおりです。

Es一致のインデックス、つまりすべての の元の位置、Hsおよび' 'seq B と一致した seq Aから取得したいと考えています。

それ、どうやったら出来るの?