Hive でカスタム UDF を作成しました。Hive コマンド ラインでテストされ、正常に動作します。これで、UDF の jar ファイルができました。ユーザーがそれを指す一時関数を作成できるようにするには、どうすればよいでしょうか? 理想的には、Hive のコマンド プロンプトから次のようにします。
hive> add jar myudf.jar;
Added [myudf.jar] to class path
Added resources: [myudf.jar]
hive> create temporary function foo as 'mypackage.CustomUDF';
この後、機能を適切に使用できるようになりました。
しかし、関数を実行するたびにjarを追加したくありません。この関数を実行できるはずです:-
- Visual Studio から HDInsight クラスターに対して Hive クエリを実行する
- コマンド ラインから SSH (Linux) または RDP/cmd (Windows) を介して Hive クエリを実行する
- Ambari (Linux) Hive ビューからの Hive クエリの実行
- HDinsight クエリ コンソール Hive エディター (Windows クラスター) からの Hive クエリの実行
したがって、どのようにクエリを実行しても、JAR は既に利用可能であり、パスに追加されている必要があります。Linux クラスターと Windows クラスターでこれを保証するプロセスは何ですか?