1

Lucene ファジー マッチングは、基本的な editDistance アルゴリズムを使用してファジー マッチングを実装します。他の類似性メトリックを使用する Lucene のあいまい一致の他の実装はありますか? 同音異義語も特定する必要があります。また、lucene のさまざまなファジー マッチング アプローチを比較してください。

4

2 に答える 2

1

Lucene が他の文字列マッチング アルゴリズムを提供しているとは思わないでください。ただし、自分で追加することはできます。これは、最もよく知られている文字列比較アルゴリズムを含む優れたライブラリです。

于 2010-05-18T13:20:20.073 に答える
0

私が行ってきたことは非常に単純で、ほとんどのシナリオで機能します (私のシナリオでは、イベント名のバージョンがわずかに変更またはドリルダウンされたダーティ テーブルから、670 万のイベント名があります。 m とのあいまい一致には、すべてのクリーンなイベント名があります)

``select distinct a.Column, b.Column 
from tableA a 
inner join tableB b 
on '%' + SUBSTRING(b.Column, x, y) + '%' = '%' + SUBSTRING(a.Column, x, y) + '%'
order by a.Column asc;``

私の問題は、部分文字列を使用せずに単純にあいまい一致を行った場合、2 つの間の命名規則が非常に不明瞭であるため、約 11 件の結果しか得られないことです。このソリューションは、すべてのドリルダウン風のイベントが、クリーン テーブル内のより広範な対応するイベントと一致していることを示しています。

于 2018-08-07T16:01:27.617 に答える