HDFS 内に保存されている json ファイル (サイズ 2 ~ 3 GB) があります。私のハエはこのフォーマットのように見えます
{ "DateTime" : 24-08-2015T00:00:00, "Cost":53.09,"UID":9,"Channel":"some Channel"}
{ "DateTime" : 25-08-2015T00:00:00, "Cost":54.09,"UID":8,"Channel":"some Channel2"}
{ "DateTime" : 24-08-2015T00:00:00, "Cost":56.09,"UID":7,"Channel":"some Channel3"}
このjsonファイルをシーケンシャルファイルに変換してjsonオブジェクトを読み取るマップリデュースを作成しようとしています。gsonを使用してより高速に実行する必要があるため、Javaオブジェクトに変換するには時間がかかります。私はそれについてグーグルで検索し、JAQL が同じことを実行できることを発見しましたが、それを実行するための Java MR コードを取得できませんでした。JAQL 用の Maven jar さえ見つかりませんでした。サーバーで明示的に設定することはできません。Javaコードを使用してそれを達成する方法はありますか?