MRJob を使用した EMRで commoncrawl データセットを使用して、数年前からいくつかの古いコードを構築しています。このコードは、MRJob サブクラス マッパー関数内で以下を使用して、ローカルで実行されているか、emr で実行されているかを判断します。
self.options.runner == 'emr'
これは機能したことがないか、機能しなくなったようです。self.options.runner はタスクに渡されないため、常にデフォルトの に設定されます'inline'
。問題は、コードがローカルで実行されているか、現在のバージョンの MRJob (v0.5.0) を使用して emr で実行されているかを判断する方法があるかどうかです。