説明のために、これがフォーラム サービスであると仮定しましょう。結果が次のようになるように、各ユーザーの投稿間の「類似性」を計算する必要があります。
among posts by user A, similarity 60%
among posts by user B, similarity 20%
...
私はマルチバイト文字列を扱っているので、ここで検索エンジンに行き詰まっていると思います。私たちはすでに Solr を使用しており、moreLikeThis も実装していますが、クエリの作成方法がよくわかりません。どんな助けでも大歓迎です!