1

これは非常に基本的に聞こえるかもしれませんが、HDFS に 3 種類のファイルを含むフォルダーがあります。例:
access-02171990
s3.Log
catalina.out

map/reduce で、access-only で始まるファイルのみを読み取りたいと考えています。プログラムを介してそれを行うにはどうすればよいですか?または入力ディレクトリパスを介して指定しますか?助けてください。

4

1 に答える 1

3

入力パスをグロブとして設定できます。

FileInputFormat.addInputPath(jobConf, new Path("/your/path/access*"))
于 2013-09-19T18:26:30.767 に答える