0

私は Hive デモに取り組んでおり、各ログ行の先頭に log4j スタイルのメッセージが先頭にある JSON メッセージを含むファイルに対して集計クエリを実行したいと考えています。

20:49:07.962 [main] INFO com.example.application - {"DocId":"ABC","User":{"Id":1236,"Username":"larry1234","Name":"Larry","ShippingAddress":{"Address1":"789 Main St.","Address2":"","City":"Durham","State":"NC","PostalCode":"27713"},"Orders":[{"ItemId":1111,"OrderDate":"11/11/2012"},{"ItemId":2222,"OrderDate":"12/12/2012"}]}} 

私はそのようなレコードを大量に持っており、Hive のデモに取り組んでいます。Hive-JSON-Serdeを認識しています。しかし、log4j プリアンブルを無視するように Hive に指示するにはどうすればよいでしょうか?

4

1 に答える 1