豚からCSVにデータを取得して、ExcelやSQL(またはRやSPSSなど)で多くの操作を行わなくても使用できるようにするのに多くの問題があります...
次の関数を使用してみました。
STORE pig_object INTO '/Users/Name/Folder/pig_object.csv'
USING CSVExcelStorage(',','NO_MULTILINE','WINDOWS');
たくさんのpart-m-0000#ファイルを含むその名前のフォルダを作成します。後でcatpart*> filename.csvを使用してそれらすべてを結合できますが、ヘッダーがないため、手動で挿入する必要があります。
PigStorageSchemaはヘッダー付きの別のビットを作成することになっていることを読みましたが、まったく機能していないようです。たとえば、ヘッダーファイルがなく、保存されたばかりの場合と同じ結果が得られます。STORE pig_object INTO'/ Users / Name / Folder / pig_object'USING org.apache.pig.piggybank.storage.PigStorageSchema();
(私はこれをローカルモードとmapreduceモードの両方で試しました)。
これらの複数の手順を使用せずに、Pigから単純なCSVファイルにデータを取得する方法はありますか?
どんな助けでも大歓迎です!