Hadoop を使用して、既存の Windows 2003 サーバー (16 GB の RAM を搭載した約 10 台のクアッド コア マシン) で大きなテキスト ファイルを処理することを考えています。
質問は次のとおりです。
Windows で Hadoop クラスターを構成する方法に関する適切なチュートリアルはありますか?
要件は何ですか?Java + cygwin + sshd ? 他に何か?
HDFS、Windows でうまく再生できますか?
ストリーミング モードで Hadoop を使用したいと考えています。C# で独自のマッパー/リデューサーを開発するためのアドバイス、ツール、またはトリックはありますか?
ジョブの送信と監視に何を使用していますか?
ありがとう