1

BLAST アルゴリズムのようなものを実行して、Unicode 文字列の大規模なデータベースを照会したいと考えています。BLAST のようなアラインメント ソフトウェアのほとんどは、入力としてヌクレオチドまたはタンパク質の文字列を想定しています。しかし、私の入力には任意の Unicode 文字が含まれている可能性があります。これを可能にするソフトウェアを知っている人はいますか? スコアリング マトリックスは、単なる単位マトリックスである可能性があります (部分的な一致はありません)。

Needleman-Wunsch と Smith Waterman を試しましたが、私の目的には遅すぎます。BLAST のように、大規模なデータベースにクエリを実行する必要があります。

ありがとうございました!

4

3 に答える 3

0

BLASTを使用して、任意のアルファベットの文字シーケンスを整列させることができます。公開されている実装のほとんどはタンパク質に合わせて調整されているため、おそらく自分で実装する必要がありますが、アルゴリズムはタンパク質やヌクレオチド配列に固有のものではありません。

于 2010-09-02T20:35:03.877 に答える
0

STELLAR を試してみることもできます。これは、検証ステップを備えたクエーサーのようなフィルター アルゴリズムです。(この論文を参照)

編集距離が 5% 未満の場合は、非常に高速です。

于 2012-08-22T07:56:25.943 に答える
0

vmatch は一般的なサフィックス ツリー ベースのアラインメント プログラムです。

于 2011-08-08T15:03:29.727 に答える