問題タブ [pairwise]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - multi-FASTA ファイル シーケンスのペアワイズ アラインメント
次世代シーケンシングから得られた 10 000 以上の fasta 配列を含む multi-FASTA ファイルがあり、クラスタリング分析を実行するために、ファイル内の各配列に対して各配列のペアワイズ アラインメントを行い、すべての結果を同じ新しいファイルに保存したいと考えています。後。FASTA シーケンスの例と、Python でペアワイズ シーケンス アラインメントを実行するためのコードを以下に示します。
FASTA配列
最初の行は、シーケンスの説明の要約が含まれているため、無視してください。
私のコード
問題
コードシーケンスだけでなく、マルチ FASTA ファイル全体をループするように変更するにはどうすればよいでしょうか。また、必要に応じて結果を効率的に保存するにはどうすればよいですか。
r - unorder ペアの一意のダイアド識別子を生成する
私が取り組んでいるデータフレームは、各観測 (つまり、行) にソースノード ( from
) とターゲットノード ( to
) が他のいくつかの 2 項共変量 (2 項相関など) と共に含まれる 2 項形式でコード化されていcorr
ます。
簡単にするために、各ダイアドを順序付けされていないものとして扱い、以下のように各ダイアドに一意の識別子を生成しますdf1
。
ここで、ダイアド AB/BA、AD/DA は同一のペアとして扱われ、同じダイアド識別子が割り当てられます。元のデータから順序付けられていないペアのリストを抽出するのは簡単ですが、それらを元のデータフレームにマッピングして順序付けられていないダイアド識別子を生成するのは困難です。誰かがこれについていくつかの洞察を提供できますか?