BLAST アルゴリズムのようなものを実行して、Unicode 文字列の大規模なデータベースを照会したいと考えています。BLAST のようなアラインメント ソフトウェアのほとんどは、入力としてヌクレオチドまたはタンパク質の文字列を想定しています。しかし、私の入力には任意の Unicode 文字が含まれている可能性があります。これを可能にするソフトウェアを知っている人はいますか? スコアリング マトリックスは、単なる単位マトリックスである可能性があります (部分的な一致はありません)。
Needleman-Wunsch と Smith Waterman を試しましたが、私の目的には遅すぎます。BLAST のように、大規模なデータベースにクエリを実行する必要があります。
ありがとうございました!