入力で複雑な json オブジェクト (1 行に 1 つ) を取り、hadoc 形式で出力するスクリプトがあります。STREAM を使用して、このスクリプトを介して豚を使用してデータをストリーミングしたいと思います。豚にjson形式でストリーミングにデータを送信させるにはどうすればよいですか? 私は次のようなものを探しています
C = stream A through `stream.py` USING JsonStorage()
入力で複雑な json オブジェクト (1 行に 1 つ) を取り、hadoc 形式で出力するスクリプトがあります。STREAM を使用して、このスクリプトを介して豚を使用してデータをストリーミングしたいと思います。豚にjson形式でストリーミングにデータを送信させるにはどうすればよいですか? 私は次のようなものを探しています
C = stream A through `stream.py` USING JsonStorage()
pig にはまだそのような実装がないようです。最良の代替手段は、json 文字列を出力するToJson UDFを使用し、ストリーミング関数で、たとえば python の json.loads(inputstring) を使用して、文字列を json オブジェクトとしてロードすることです。