私は少し壁にぶつかりました。いくつかのガイダンスをいただければ幸いです。次のような大きなテキスト ブロックのインデックスを作成したい:
ゴルフクラブの更衣室に数人の男がいる。ベンチに置かれた携帯電話が鳴り、男性がハンズフリー スピーカー機能を使用して話し始めます。部屋の他の全員が立ち止まって耳を傾けます。男は電話を切る。更衣室にいる他の男たちは驚いて彼を見ている. それから彼は微笑んで尋ねます:「誰の電話か知っている人はいますか???!!!」
このフルテキストをそのまま Solr に保存したくありません。代わりに、2 つのバージョンを保持したいと考えています。1 つは切り捨てられた形式で、もう 1 つはキーワード形式です。
切り捨てられたフォーム:
ゴルフクラブの更衣室に数人の男がいる。ベンチに置かれた携帯電話が鳴り、男性がハンズフリー スピーカー機能を使用して話し始めます。他のみんな...
キーワード形式 (一般的な単語を削除するためにストップワードを使用):
数人の男性 更衣室 ゴルフ クラブ 携帯電話 ベンチが鳴る 男性 ハンズフリー スピーカー機能を使用 話し始める 他の全員の部屋が止まる 話を聞く 男性が電話を切る 他の男性 更衣室で彼を見ている 驚きの笑顔で尋ねる 誰の電話か知っている
これをどのように行う必要がありますか。