1

私はステミングにある程度精通していますが、プロジェクトに使用するために与えられたステミング ライブラリは、次のいずれかのクエリを実行する場合のように、関連する単語を見つけたい場合にはうまく機能しません。

「歯科」、「歯医者」、「歯科」

私は他の人たちと一致するはずです。私はこれを調べていて、関連語やトロポニムなど、存在さえ知らなかった品詞について学んでいるので、これらすべての間のマッピングを持つライブラリがそこにないのではないかと思っています私が探している種類の一致を返すことができるさまざまな品詞?

私はこれを検索してきましたが、理解できるものはあまり見つかりませんでした。私はおそらく正しい用語などを知らないので、誰かが私を正しい方向に向けることができれば幸いです.

4

2 に答える 2

2

WordNetを見てください。WordNet は、単語と概念の組織化されたオントロジーであり、単語間のさまざまなタイプの関係へのリンクが含まれています。あなたが望む関係が正確に得られるかどうかはわかりませんが、おそらく良いスタートです. さまざまなプログラミング言語 (私が使用した Java と Python; おそらくもっと多くの言語) には多くのインターフェイスがあります。

于 2012-04-20T20:11:50.633 に答える
2

IR で一般的なアプローチの 1 つは、インデックス内のすべての単語とクエリ自体をステミングすることです。つまり、'dentistry' という単語を含むドキュメントはステミングされ、'dentist' としてインデックスに保存されます。キーワード 'dental' も 'dentist' として抽出され、インデックス内で一致します。

于 2012-04-21T03:23:42.323 に答える