Solrファセットを利用したタグクラウドのロジックの背後に立ち往生しているようです。まず、OpenNLPを使用してドキュメントを解析し、そこから関連する単語を取得しているため、すべてのドキュメントがn個の単語に分割されます。そして、基本的に私のSolrの応答は次のようになります。
<docID>
<title>My Doc Title</title>
<content>My Doc Title</content>
<date_published>My Doc Title</date_published>
</docID>
ここに言葉を統合する方法があるに違いないと思います。私は最初にこのようなことを考えました:
<docID>
<title>My Doc Title</title>
<content>My Doc Title</content>
<date_published>My Doc Title</date_published>
<words>word</words>
<words1>word1</words1>
<words2>word2</words2>
<words3>word3</words3>
<wordsN>wordN</wordsN>
</docID>
しかし、docIDごとにいくつの単語フィールドを取得するかわからないため、ファセットは不可能です。その場合、ファセットはフィールド間で実行する必要があります(これは可能かどうかさえわかりません)。考えられる答えを調べようとしていますが、行き詰まっているようです...最後に、インデックスにある各ドキュメントを取得するn語のファセットを作成する必要があります。考えていただければ幸いです。