巨大なファイル (ASCII 文字のみを含む) があり、最も頻繁に表示される文字を見つける必要があります。
私のアプローチ:
- ファイルを分割し、多数の処理ノードに配布します。
- 各ノードは文字をカウントし、文字カウント配列 [256] を生成します。
- 親ノードは、すべてのノードからすべてのカウント配列を受け取り、最も頻繁に使用される文字を計算します。
しかし、ノードがカウント配列全体を転送して、最も頻繁に使用される文字を計算する必要があるかどうか疑問に思っていますか? ノード間で転送される処理済みデータの量を減らす方法はありますか。
注: 私は分散プログラミングに慣れていないので、基本的なテクニックに慣れようとしています。