AATGGGTTCCA
複数のシーケンスで文字列シーケンスを探しています。ただし、N 個の編集距離 (文字列への置換または挿入) を許可したい
したがって、長い文字列では、AATG* C *GTTCCA (置換) または AATGGTTCCA (削除) または AATGGG* T *TTCCA (挿入)に一致する可能性があります。
多くのシーケンスを処理する場合、最速のアルゴリズムは何ですか?
編集: 無限の文字列に一致させることができるため.. 最大 5 か所の 1 つのヌクレオチドの挿入、削除、または置換を想定しましょう BLAST もオプションになります