私はHadoopとPigを初めて使用します。UDFメソッドを内部的に呼び出すpigスクリプトを実行する方法を知りたいですか?問題は、PigUDFマニュアルサイトのように言及されている「registerblah.jar」というステートメントが表示されないことです。
register myudfs.jar;
A = load 'student_data' as (name: chararray, age: int, gpa: float);
B = foreach A generate flatten(myudfs.Swap(name, age)), gpa;
C = foreach B generate $2;
D = limit B 20;
dump D;
しかし、「blah.jar」を含む「jar」ディレクトリが表示されます。私の同僚はすでに去っていたので、私はトリックが何だったのだろうか?たぶん私はjarファイルをコマンドラインに追加できますか?
どうもありがとう!