1

ハイブ クエリの複数の出力ファイルを取得します。したがって、私の最初の質問は、出力を 1 つのファイルだけに設定できるかということです。また、0000 の代わりに独自の出力名を選択できますか?

参考までに、私はjarファイルを使用してジョブをhadoopに送信していません。その代わりに、仕事にハイブクエリを使用しています。では、出力ファイル名の名前を変更するにはどうすればよいですか。

4

1 に答える 1

3

リデューサーの数を 0 に設定することで、単一のファイルを出力として持つことができます。これは、Hive CLI から実行できます。

hive>  set mapred.reduce.tasks = 1;

はい、出力ファイルの名前を変更できます。クラスをサブクラス化し、OutputFormat.java独自のクラスを作成できます。TextOutputFormat.java や MultipleOutputFormat.java などのコードを参考にしてください。そのためには、そのクラスをサブクラス化し、変更が必要なメソッドをオーバーライドするだけです。

于 2013-06-10T10:31:03.167 に答える