基本的に、あなたの経験では、「ビッグ (っぽい) データ」の問題に直面した場合、Hadoop のようなものと比較して、Python のマルチプロセッシング モジュールを使用してどこまで到達できますか?
Python/SQL の習熟度は別として、私は「プログラミング初心者」なので質問します。したがって、Hadoop は現時点では私にはまったく理解できないので、少なくとも Hadoop について理解できるようになるまでは、マルチプロセッシング モジュールを使用して、多くの大規模なデータの問題に対処できるようになることを願っています。
わかりやすくするために編集: 4 コアのコンピューターを使用している場合、マルチプロセッシング モジュールとは対照的に、4 ノードで Hadoop を使用する利点はありますか?
ありがとう。