私は非常に単純な分散コンピューティング プラットフォーム (Map/Reduce パラダイムに基づく) を作成しました。現在、いくつかのデモとショーケースを作成中です。私は非常に小さなチームを持っており、どのデモを最初に作成するかを優先する必要があります。
優先順位を付けるには、約 70% が分散コンピューティングの関連性があり、一般的で重要なユース ケースであり、30% が記述しやすいというように、デモを並べ替える必要があります。
これまでのところ、次のように注文しました。
- モンテカルロで円周率を発見する
- モンテカルロによる数値積分
- 大行列乗算 (密行列)
- 線形回帰
- 大行列反転
- 複数の回帰
- 並べ替え
- クラスタリング (K-Means)
- クラスタリング (階層的)
数字の 1 がリストにあるのは、書くのに 10 分かかったからです。ただし、まったく役に立ちません (よくわかりませんが、円周率の桁数をもっと見つけようとしている人はあまりいないと思います)。
私のプラットフォームの性質上、もちろん恥ずかしいほど並列であり、I/O バウンドやリデュースドミネートではないものでより輝きます。
私のリストをどのように変更しますか? それに何を追加しますか?並べ替えは企業の世界でまったく役に立ちますか?それとも、分散コンピューティング プラットフォームのベンチマークのためだけのものですか?