algorithm - アマゾンインタビュー問題

Question

動的に変化する単語の大きなファイルがあります。いくつかの単語を継続的に追加しています。それぞれの瞬間に流行語のトップ 10 を追跡するにはどうすればよいでしょうか?

ブログでこの質問を見つけましたが、答えがわかりませんでした。答えは: ハッシュテーブル + 最小ヒープ

最小ヒープ部分ではなくハッシュテーブルの理由を理解しています。誰かが私を助けることができますか?

score 8 · Accepted Answer

その場合は、 aとともに atop 10 trending wordsを使用する必要があります。max-heaphash-table

新しい単語がファイルに追加されると、次のようになります。

既存の単語がファイルに追加されると、次のようになります。

次に取得する必要がある場合top 10 trending words:

ご覧のとおり、必要なすべての操作はせいぜいで行われO(lgn)ます。

score 1 · Accepted Answer

トップ10だけを維持したい場合は、最大ヒープを使用するのはやり過ぎです。ソートされた配列に10個のエントリを保持することは、より簡単で高速になります。

並べ替えには、配列の下から挿入ソートを使用します。候補者がすでにトップ10に入っているかどうかを確認し、必要に応じてその位置を更新する必要があります。

2 に答える 2