ハイブ クエリの複数の出力ファイルを取得します。したがって、私の最初の質問は、出力を 1 つのファイルだけに設定できるかということです。また、0000 の代わりに独自の出力名を選択できますか?
参考までに、私はjarファイルを使用してジョブをhadoopに送信していません。その代わりに、仕事にハイブクエリを使用しています。では、出力ファイル名の名前を変更するにはどうすればよいですか。
リデューサーの数を 0 に設定することで、単一のファイルを出力として持つことができます。これは、Hive CLI から実行できます。
hive> set mapred.reduce.tasks = 1;
はい、出力ファイルの名前を変更できます。クラスをサブクラス化し、OutputFormat.java
独自のクラスを作成できます。TextOutputFormat.java や MultipleOutputFormat.java などのコードを参考にしてください。そのためには、そのクラスをサブクラス化し、変更が必要なメソッドをオーバーライドするだけです。