問題タブ [external-tables]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
6992 参照

oracle - 外部テーブルの場所とファイル名を取得していますか?

外部テーブルの一部として複数のファイルを処理しています。外部テーブルで処理されているファイル名を取得してテーブルに配置する方法はありますか?

現時点で私が見つけた唯一の解決策は、フラット ファイル内のすべてのレコードにファイル名を追加することです。これは、効率の観点から理想的ではなく、元のデータを変更する必要があります。外部テーブルは、どのファイルが処理されているかを常に認識していますか?

0 投票する
1 に答える
3506 参照

elasticsearch - Hive 外部テーブルの日付フィールドを照会できません

ハイブ外部テーブルからのデータのフェッチに完全に行き詰まりました。私は今まで以下を行ってきました。

  1. 値が 2014-10-23 の日付フィールドを持つ管理対象テーブルがありました。
  2. 以下のようなエラスティック検索でデータを保存するための外部テーブルを作成しました

    外部テーブル ext3 を作成します ( run_date date) ROW FORMAT SERDE 'org.elasticsearch.hadoop.hive.EsSerDe' STORED BY 'org.elasticsearch.hadoop.hive.EsStorageHandler' TBLPROPERTIES('es.resource' = 'dfs/ext3', ' es.field.read.empty.as.null' = 'true','es.nodes'=);

  3. 外部テーブルに 1 行を挿入して、Elastic Search インデックスとマッピングを作成します。

問題 1: エラスティック検索フィールドが文字列として作成されます。

  1. 後で、エラスティック検索のマッピングを日付に変更しました。

    "run_date":{"type":"date", "format": "yyyy-MM-ddZ", "index": "not_analyzed"}

  2. 外部テーブルにデータを再挿入しました。エラスティック検索をクエリすると、非常にうまくいきます。値は「2014-10-23+08:00」と表示されます

問題 2 select count(*) from ext3 のような外部テーブルのデータをクエリすると、以下のエラーが発生します。

みんなこれで私を助けてください、一日が無駄です。より多くのデータを含む別の外部テーブルがあり、これら 2 つのテーブルを結合してビューを作成し、統合されたデータを分析できるようにする必要があります。