用語をランダムに描き、原文のまま配布したいと思います。言い換えれば、すべての索引付けされた文書で「elephant」という単語が「hippopotamus」という単語の 2 倍の頻度で出現する場合、ランダム抽選では 2 倍の頻度で出現するはずです。これは効率的な方法で行う必要があります。
インデックスはこのための理想的なデータ構造ではないように思えますが、魅力的です。すべての用語とその頻度が含まれています。
用語をランダムに描き、原文のまま配布したいと思います。言い換えれば、すべての索引付けされた文書で「elephant」という単語が「hippopotamus」という単語の 2 倍の頻度で出現する場合、ランダム抽選では 2 倍の頻度で出現するはずです。これは効率的な方法で行う必要があります。
インデックスはこのための理想的なデータ構造ではないように思えますが、魅力的です。すべての用語とその頻度が含まれています。