string - Needleman Wunsch アルゴリズムはブルートフォースと比べてどうですか?

Question

Needleman-Wunsch アルゴリズム (通常、ヌクレオチド/タンパク質配列の整列に使用されます) の結果をどのように定量化できるのでしょうか。

一定のスコアリングスキームと、長さが異なるとの 2 つのシーケンスを考えてみましょS1うS2。とのすべての可能なアラインメントを力ずくで計算S1しS2、最高スコアのアラインメントにはスコアがあるとしxます。もちろん、これは Needleman-Wunsch アプローチよりもかなり複雑です。

Needleman-Wunsch アルゴリズムを使用して配列アラインメントを見つける場合、スコアがあると言いますy。

は、2 つのランダムシーケンスおよびrに対して Needleman-Wunsch によって生成されたスコアであると考えてください。R1R2

xと比べてどうyですか？相同性が既知の 2 つの配列yよりも常に大きいですか?r

一般的に、Needleman-Wunsch アルゴリズムを使用して配列アラインメントを大幅に高速化することは理解していますが (力ずくのアプローチと比較して)、それに伴う精度のコスト (もしあれば) については理解していません。元の論文 (Needleman & Wunsch, 1970) を読んでみましたが、まだこの疑問が残っています。

score 5 · Accepted Answer

Needlman-Wunsch は、常に最適な答えを生成します。これは、総当たりよりもはるかに高速であり、プロセスの精度を犠牲にしません。それが使用する重要な洞察は、考えられるすべてのアラインメントを実際に生成する必要はないということです。それらのほとんどには不適切なサブアラインメントが含まれており、おそらく最適ではないからです。代わりに、Needleman-Wunsch アルゴリズムは、元の鎖のフラグメントの最適なアラインメントをゆっくりと構築し、最適なアラインメントにはわずかに小さいケースの最適なアラインメントが含まれている必要があるという保証を使用して、これらの小さなアラインメントを大きなアラインメントにゆっくりと成長させることによって機能します。

score 2 · Accepted Answer

あなたの質問は、動的計画法が最適な解決策を見つけるかどうか、つまりy >= x. これについての議論のために、私はおそらく私より頭が良い人たちに言及します:

https://cs.stackexchange.com/questions/23599/how-is-dynamic-programming-different-from-brute-force

基本的に、動的計画法は最適な結果を生成する可能性が高い、つまりブルートフォースと同じですが、ベルマンの最適性の原則を満たす特定の問題に対してのみ、と述べています。

Needleman-Wunsch のウィキペディアのページによると、この問題はBellman の最適性の原則を満たしています。

https://en.wikipedia.org/wiki/Needleman%E2%80%93Wunsch_algorithm

具体的には：

Needleman–Wunsch アルゴリズムは、特にグローバルアライメントの品質が最も重要な場合に、最適なグローバルアライメントのために今でも広く使用されています。ただし、このアルゴリズムは、2 つのシーケンスの長さの積に比例して時間と空間の点でコストがかかるため、長いシーケンスには適していません。

同じウィキペディアのページの他の場所にも最適性についての言及があります。

string - Needleman Wunsch アルゴリズムはブルート フォースと比べてどうですか?

2 に答える 2

Related

Reference

string - Needleman Wunsch アルゴリズムはブルートフォースと比べてどうですか?