0

drill-embed で apache ドリルをテストしようとしていますが、json ファイルはすべて jl.gz ファイル拡張子を持つ jsonline ファイルです。

それらの名前を json.gz に変更すると機能しますが、これは私の場合は望ましくありません。

jl.gz ファイルが実際に json であることをドリルに伝えるにはどうすればよいですか?

PS: $CP に a を追加しようとしましたbootstrap-storage-plugins.jsonが、drill-embed で読み取れないようです。

4

1 に答える 1

0

はい、ブートストラップを使用しないでください。これは分散環境専用であり、Web コンソールまたは REST APIを使用することをお勧めします。gz 拡張子を持つ解凍された JSON ファイルではなく、gz ファイルを圧縮する必要があることはおそらく言うまでもありません。デフォルトの dfs ストレージ プラグインに基づいて、myplugin などの新しいストレージ プラグイン構成を作成します。

  1. Drill シェルを起動し、 に進みhttp://<IP address or host name>:8047ます。ツールバーで [ストレージ] を選択します。dfs ストレージ プラグイン構成がデフォルト構成のリストに表示されます。
  2. [ストレージ] タブの [有効なストレージ プラグイン] で、[更新] をクリックして dfs ストレージ プラグインの構成をコピーします。プラグインの構成が表示されます。
  3. 構成をコピーして戻ります (構成をキャンセルするだけです)。
  4. [ストレージ] タブで、[新しいストレージ プラグイン] に名前を入力します。たとえば、myplugin と入力します。Drill に登録された各構成には、個別の名前が必要です。名前は大文字と小文字が区別されます。
  5. [作成] をクリックします。
  6. [構成] の [フォーマット] セクションで、json フォーマットを変更して拡張子「gz」を指定します。

    "json": { "type": "json", "extensions": [ "gz" ] },

  7. [作成] をクリックします。

ここで、Drill シェルで、something.gz という名前の JSON ファイルをクエリできます。

use myplugin;
select * from `/Users/me/donuts.gz` limit 2;
于 2015-10-21T13:47:37.990 に答える