別の Pig スクリプトによって生成された出力パーツ ファイルを分割し、それぞれが 1000 行を含むグループを生成する必要があります。これらのグループは、さらに処理するために Web サービスに投稿されます。データ間に関係がないため、特定のフィールドでデータをグループ化することはできません。
豚でこれを行うにはどうすればよいですか?
別の Pig スクリプトによって生成された出力パーツ ファイルを分割し、それぞれが 1000 行を含むグループを生成する必要があります。これらのグループは、さらに処理するために Web サービスに投稿されます。データ間に関係がないため、特定のフィールドでデータをグループ化することはできません。
豚でこれを行うにはどうすればよいですか?