SOLR がフリー テキスト検索を実行できることは知っていますが、SOLR テキスト フィールド内の一般的な用語をファセット処理するためのベスト プラクティスは何ですか?
たとえば、「プライベート ガレージ」、「プライベート ガーデン」、「プライベート パーキング」、「地下駐車場」、「堅木張りの床」、「プライベート ガレージ」、「プライベート ガーデン」、「プライベート パーキング」、 「2 階建て」など、他にも数十件あります。
ユーザーがこれらの用語ごとにプロパティの数を確認できるビューを作成し、ユーザーが関連するプロパティにドリルダウンできるようにしたいと考えています。
明白な解決策の 1 つは、データを前処理し、テキストを解析し、ブール値の yes/no 値を使用してこれらのキー フレーズごとにファセットを作成することです。
理想的にはこれを自動化したいので、SOLR フリーテキスト検索エンジンでこれが可能になると思いますか? たとえば、フリー テキスト検索エンジンを使用してストップ ワードを削除し、ユーザーに表示できる一般的なフレーズの数を収集できますか?
前処理が唯一の方法である場合、これまたはこの機能を実行するオープン ソース ライブラリに対する一般的な/ベスト プラクティスのアプローチはありますか?
SOLR でテキスト フィールドから一般的なフレーズを数えてグループ化するためのベスト プラクティスは何ですか?