Pig スクリプトから呼び出す Python で記述されたユーザー定義関数があります。デバッグの目的で、変数の一部を出力したいのですが、print ステートメントは何の効果もないようです。Pig で Python UDF から印刷するにはどうすればよいですか?
1332 次
1 に答える
0
一般に、以下の例のように印刷すると (これは私にとってはうまくいきます)、UDF を実行するタスクのログに移動します。ここで複雑な部分は、ジョブトラッカーを介してそれを生成した関連する map/reduce タスクを見つけることです (pig 11 では、pig が各フェーズを stdout に書き込むため、より簡単です)
@outputSchema("schema:chararray")
def convertBagToStr(acctBag):
#print len(acctBag)
#print acctBag
return "_".join([str(i[0]) for i in sorted(acctBag)])
于 2014-01-02T12:23:02.800 に答える