3

あいまい文字列マッチングの分野は初めてです。

Bitapアルゴリズムの使用法を模索していますが、これまでのところ、パターンの長さが限られているために問題が発生しています。私はFlashを使用しており、32ビットの符号なし整数とIEEE-754倍精度浮動小数点数型を処理しています。これは最大53ビットを整数に使用できます。それでも、50文字より長いパターンを処理できるあいまいマッチングアルゴリズムが必要です。

Bitapアルゴリズムのウィキペディアのページにはlibbitapが記載されています。これは、アルゴリズムの無制限のパターン長の実装を示していると思われますが、そのソースからアイデアを得るのに苦労しています。

無制限の長さのパターンに対してBitapを一般化する方法、または干し草の山の提案された場所の近くで針のあいまい文字列マッチングを実行できる別のアルゴリズムについて何か提案がありますか?

4

1 に答える 1

2

このアルゴリズムのかなり明確な実装がgoogle codeで入手できます。それを試してみてください。あいまい一致の正確な位置 (テキストの開始点と終了点) を取得する方法はわかりませんが。開始点と終了点の両方を取得する方法がわかっている場合は、共有してください。

于 2009-11-27T10:59:52.320 に答える