私は豚の知識がほとんどありません。protobuf 形式のデータ ファイルがあります。このファイルを pig スクリプトにロードする必要があります。それをロードするには、LoadFunc UDF を作成する必要があります。言う機能がございますProtobufloader()
。
私のPIGスクリプトは
A = LOAD 'abc_protobuf.dat' USING Protobufloader() as (name, phonenumber, email);
私が知りたいのは、ファイル入力ストリームを取得する方法です。ファイル入力ストリームを取得したら、データを protobuf 形式から PIG タプル形式に解析できます。
PS: よろしくお願いします