私はハイブクエリを含むプロジェクトに取り組んできました。
INSERT INTO OVERWRITE .... TRANSFORM(....)USING'python script.py' FROM .... LEFTOUTERJOIN。。。左外側の結合。。。左アウタージョイン
最初は、大量のダミーデータをロードするまで、すべてが正常に機能します。一部のフィールドに小さなバリエーションを加えて同じレコードを書き込むだけです。その後、これを再度実行すると、多くの情報なしでパイプの破損エラーが発生します。エラーに関するログはありません。IOException:パイプの破損エラーのみです。。。。
スクリプトを単純化し、エラーを分離するために、スクリプトを次のように変更します
for line in sys.stdin.readlines():
print line
そのレベルでのエラーを回避するため。まだ同じエラーがあります。