Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
大きなデータを処理するコードをJavaで記述しました。これを複数のマシンに配布して、データの一部を処理し、処理をより迅速に実行したいと考えています。私はこれまで分散コンピューティングに取り組んだことがありません。これを行うためのツールはありますか?ありがとう。
Gridgainはかなりうまく機能します。Hadoopは素晴らしいものですが、より多くの開発者が必要です。ヘーゼルキャストのカウルは良い部外者になる
他の人も引用できますが、どのような種類のデータと処理が関係しているかを知らずにあなたの質問に答えることは困難です。プロセスはI/O集約的ですか、それともCPUバウンドですか?
質問の1つは、「データセットの大きさはどれくらいですか?」です。
マップリデュースアルゴリズムを実行したいようです。
Hadoopは、まさにそれを行うためのフレームワークを提供するオープンソースプロジェクトです。