圧縮されていない JSON ファイルを問題なくクエリする Apache Drill がありますが、gz 圧縮された JSON アーカイブに苦労しています。
私の理解では、Drill は gz ファイルを処理できると私が信じていた Hadoop ファイル コネクタを使用していますが、Drill の JSON クエリ機能は常に .json ファイルにロックされているようです。
私はこのようなことを試みました:
"formats": {
"gz": {
"type": "json"
}
}
ただし、ファイルが見つからないというエラーが発生します。これも試しました:
"formats": {
"json": {
"type": "json",
"extensions": [
"gz"
]
}
}
「無効な JSON マッピング」エラーが発生します。