大量のデータで文字列照合を行っています。
編集:私はいくつかのオントロジーテキストファイルと大きなリストに含まれている単語を一致させています。オントロジーから各ファイルを取得し、各ファイル行の3番目の文字列とリストの任意の単語との一致を検索します。
私がしなければならないのは純粋なマッチングではない(結果が悪い)という事実を監視するのを間違えましたが、文字列が別の文字列内に含まれている場合にも結果を返す、より緩いマッチング関数が必要です。
私はこれをRadixTrieで行いました。非常に高速でうまく機能しましたが、トライは完全一致のみを返すため、今では私の作業は役に立たないと思います。:/
- これを行うアルゴリズムのタイプは文字列検索アルゴリズムですか?
- 誰かが彼が経験したいくつかのJava実装を提案できますか?
アルゴリズムは高速である必要がありますが、最優先事項ではなく、速度と複雑さで妥協します。
すべてのアドバイス/例/説明/リンクにとても感謝しています!
ありがとうございました!