lucene - Lucene インデックスからランダムな用語を引き出すにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/15041048 2013-02-23T13:29:07.843

71 次

用語をランダムに描き、原文のまま配布したいと思います。言い換えれば、すべての索引付けされた文書で「elephant」という単語が「hippopotamus」という単語の 2 倍の頻度で出現する場合、ランダム抽選では 2 倍の頻度で出現するはずです。これは効率的な方法で行う必要があります。

インデックスはこのための理想的なデータ構造ではないように思えますが、魅力的です。すべての用語とその頻度が含まれています。

0 に答える 0