map-reduce ジョブは初めてです。基本的な質問かもしれませんが、既存のドキュメントは役に立ちませんでした。luigi を使用して mapreduce ジョブを実行する方法。たとえば、 wordcount_hadoop.py ジョブを開始するために渡す必要があるパラメーターは何ですか
python examples/wordcount_hadoop.py --date-interval 2012-06-01
出力:
usage: wordcount_hadoop.py [-h] [--scheduler-port SCHEDULER_PORT] [--lock]
[--workers WORKERS] [--lock-pid-dir LOCK_PID_DIR]
[--scheduler-host SCHEDULER_HOST]
[--local-scheduler] [--pool POOL]
{BaseHadoopJobTask,EnvironmentParamsContainer,JobTask,Task,WordCount,WrapperTask} ...
wordcount_hadoop.py: error: argument {BaseHadoopJobTask,EnvironmentParamsContainer,JobTask,Task,WordCount,WrapperTask}: invalid choice: '2012-07' (choose from 'JobTask', 'Task', 'WrapperTask', 'WordCount', 'EnvironmentParamsContainer', 'BaseHadoopJobTask')