エラスティックmapreduceストリーミングジョブの引数としてS3ディレクトリを渡そうとしていますが、EMRが引数として渡したディレクトリをストリーミングマッパー自体と混同しているようです。
つまり、次のコマンドで実行すると、正常に動作します。
"-mapper","perl sams_to_vcf.pl -ref ./ref_genome.fa -vars-only -no-dups",
しかし、ディレクトリ引数を追加すると、次のようになります。
"-mapper", "perl sams_to_vcf.pl -ref ./ref_genome.fa -vars-only -outdir s3://ht-out/Fd09/combined -no-dups",
私は次のようになります:
"LastStateChangeReason": "Streaming mapper doesn't exist: s3:\/\/ht-out\/Fd09\/combined",
これはEMRまたはHadoopのバグであると確信していますが、念のため、これが機能しない理由がありますか?