2

圧縮されていない JSON ファイルを問題なくクエリする Apache Drill がありますが、gz 圧縮された JSON アーカイブに苦労しています。

私の理解では、Drill は gz ファイルを処理できると私が信じていた Hadoop ファイル コネクタを使用していますが、Drill の JSON クエリ機能は常に .json ファイルにロックされているようです。

私はこのようなことを試みました:

"formats": {
  "gz": {
    "type": "json"
  }
}

ただし、ファイルが見つからないというエラーが発生します。これも試しました:

"formats": {
  "json": {
    "type": "json",
    "extensions": [
       "gz"
     ]
  }
}

「無効な JSON マッピング」エラーが発生します。

4

1 に答える 1

1

これは、最新のマスター ブランチ (0.8) で修正されたバグでした: https://issues.apache.org/jira/browse/DRILL-1871

私のテストでは、問題なく動作し、まだ問題が発生していることが確認されていますが、いくつかの結果が得られます.

于 2014-12-17T22:37:07.027 に答える