0

非常に大きなファイルから単語を数える必要があるとします (単語は " " で分割されます)。

私は次のようにします

  1. ファイル全体をメモリにロードせず、ストリームを 1 行ずつ読み取ります。
  2. 行ごとに単語を分割し、個別の単語を「辞書」に追加します(つまり、 .NET で辞書クラスを使用します)。

次に、最も頻繁に使用される単語を取得するために、辞書を並べ替えて取得します。

しかし、ほとんどのソリューションは、このための Trie Data 構造を支持しています。理由を明確にしてください (また、辞書よりもテーブルをハッシュしない理由が明確にされていれば素晴らしいと思います)。

ありがとう。

4

2 に答える 2