mrjob は初めてで、Amazon EMR でジョブを実行するのに問題があります。順番に書いていきます。
- ローカル マシンで mrjob を実行できます。しかし、/home/ankit/.mrjob.conf と /etc/mrjob.conf に mrjob.conf がある場合、ローカル マシンでジョブが実行されません。これが私が得ているものです。https://s3-ap-southeast-1.amazonaws.com/imagna.sample/local.txt
- ドキュメントの「MR_CONFで指定した場所」のMRJOB_CONFとは?
- 「base_tmp_directory」の用途は何ですか? また、ジョブを開始する前に S3 に入力データをアップロードする必要がありますか?それとも、実行を開始するときにローカル コンピューターからロードされますか?
- numpy、scikit などのライブラリを使用する場合、ブートストラップを行う必要がありますか? はいの場合、どのように?
- これは、EMR https://s3-ap-southeast-1.amazonaws.com/imagna.sample/emr.txtでジョブを実行するコマンドを実行したときに得られるものです。
解決策はありますか?
どうもありがとう。