4 コアのデスクトップがあり、すべてのコアを Hadoop によるローカル データ処理に使用したいと考えています。(つまり、ローカルでデータを処理するのに十分な能力がある場合もあれば、同じジョブをクラスターに送信する場合もあります)。
デフォルトでは、hadoop ローカル モードは 1 つのマッパーと 1 つのレデューサーのみを実行するため、ローカル ジョブは非常に低速です。「面倒な」構成と、毎回jarを作成する必要があるため、最初に単一のマシンにクラスターをセットアップしたくありません。完璧な解決策は、単一のマシンで組み込み Hadoop を実行する方法です
PS 疑似分散モードは、単一ノードでクラスターを作成するため、不適切なオプションです。そのため、マッパーは 1 つしか取得できず、追加の構成に時間を費やす必要があります。