さまざまな分散マシンで、文字列と正の整数をキーと値のペアとしてマップしました。すべてのサーバーで最も値が高い文字列を見つける必要があります。
すべての場所からマップ全体を転送することは、費用がかかり、分散型の性質に反するため、避けるべきです。
この問題を最適に解決する方法はありますか?
さまざまな分散マシンで、文字列と正の整数をキーと値のペアとしてマップしました。すべてのサーバーで最も値が高い文字列を見つける必要があります。
すべての場所からマップ全体を転送することは、費用がかかり、分散型の性質に反するため、避けるべきです。
この問題を最適に解決する方法はありますか?
教科書のMapReduceの問題のように聞こえます。すべてのノードから情報を収集するマスターが必要です。各ノードは、最大の文字列/値アイテムをマスターに報告する必要があります。マスターは、誰が最大値の文字列を持っているかを簡単に判断できます。