特定の単語やフレーズに基づいてドキュメントを検索しない概念検索 (または概念ベースの検索) について尋ねていますが、共通の用語や共通言語に関係なく、概念的に関連する関連ドキュメントを返します。
例: キーワード「BMW」を使用すると、結果には「高価な車」などが含まれます。
私はすでに Apache solr に基づく検索エンジンを持っています。概念検索を実装する方法と、検索エンジンで使用する概念の辞書がある場合、いつそれを見つけることができますか?
特定の単語やフレーズに基づいてドキュメントを検索しない概念検索 (または概念ベースの検索) について尋ねていますが、共通の用語や共通言語に関係なく、概念的に関連する関連ドキュメントを返します。
例: キーワード「BMW」を使用すると、結果には「高価な車」などが含まれます。
私はすでに Apache solr に基づく検索エンジンを持っています。概念検索を実装する方法と、検索エンジンで使用する概念の辞書がある場合、いつそれを見つけることができますか?
そのようなインテリジェントな検索を行うには、(検索エンジンの機能を補完するために) 機械学習を検討する必要があります。コーパスを理解する必要があり、クエリが実行されたときに、意味/意味によって (レーベンシュタイン距離ではなく) 類似した用語を提案する必要があるためです。 )。
Solr やその他の検索エンジンは、データを理解することを意図したものではありません。データの高度な分析と変換を実行できるようにするだけです。私の知る限り、検索エンジンでできることは同義語を使用することですが、それだけでは十分ではありませんか?
Apache Mahout、Apache UIMA、およびApache OpenNLPを見てください。