問題タブ [hdp]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

249 問題

0 投票する

4 に答える

1117 参照

hive - Hive を含む ORC ファイル: java.io.IOException: Two Reader

ORC 形式のファイルを含む ACID ハイブテーブルがあります。圧縮を試みると、最終的に次のエラーが発生Task: ... exited : java.io.IOException: Two readers for ...します。完全なエラーは次のとおりです。

mergeこのテーブルはavro ファイルを orc テーブルに 'ing することによって作成および更新されるため、delete_deltaとdelta.

私はこの問題を抱えていない他の多くのテーブルを持っています。このテーブルには異常はなく、実際には非常に小さく (<100k 行、ディスク上で 2.5M)、先月 100 回更新されました (20k 行が更新され、5M 更新データ)。DDL は次のとおりです。

これは数か月ごとに発生します。他のすべて (選択、マージ) が機能するため、修正は通常、2 番目のテーブル ( create table t as select * from contact_group) を作成してテーブルを切り替えることですが、本当の根本的な理由を見つけたいと思います。

エラーについて見つけた唯一の参照はコード自体にありますが、これはあまり役に立ちません。

これは、Hive 3 を使用した hdp3.1 にあります。

2019-06-03T06:58:28.037

0 投票する

1 に答える

1798 参照

apache-spark - Hive Warehouse Connector + Spark = 署名者情報が同じパッケージ内の他のクラスの署名者情報と一致しない

最も単純な例（以下）でも例外を取得しようとしていhive warehouse connectorますspark。hdp 3.1問題を引き起こしているクラス: JaninoRuntimeException- はorg.codehaus.janino:janino:jar:3.0.8(spark_sql の依存関係) およびにありcom.hortonworks.hive:hive-warehouse-connector_2.11:jarます。

janino ライブラリを spark_sql から除外しようとしましたが、これにより janino から他のクラスが失われました。そして、新しい機能のために hwc が必要です。

誰でも同じエラーが発生しましたか？それに対処する方法はありますか？

エラーが発生します：

私のsbtファイル：

そしてソースコード：

apache-spark hive hortonworks-data-platform hdp

2019-06-14T07:14:22.897

0 投票する

0 に答える

232 参照

r - Sparkly を HDP-Sandbox Spark インスタンスに接続する

R インスタンスを、1 台のローカルマシン上の Docker にデプロイされた HDP-Sandbox で実行されている Spark に接続したいと考えています。エラーメッセージは、--versioncall onspark-submitが失敗したことを示しています。

R インスタンス

エラーsystem2(file.path(spark_home, "bin", "spark-submit"), "--version", : コマンドの実行中にエラーが発生しました

HDP

アップデート

より簡単な解決策と思われるので、Livy を使用することにしました。8999ファイルで参照されているポートを開いたので、livy.confで Livy UI にアクセスできるようになりましたhttp://localhost:8999/ui。

それにもかかわらず、接続しようとするとエラーが発生し続けます。

r apache-spark sparklyr livy hdp

2019-06-15T18:44:01.940

1 2 3 4 5 6 7 8 9 10

問題タブ [hdp]

hive - Hive を含む ORC ファイル: java.io.IOException: Two Reader

apache-spark - Hive Warehouse Connector + Spark = 署名者情報が同じパッケージ内の他のクラスの署名者情報と一致しない

r - Sparkly を HDP-Sandbox Spark インスタンスに接続する

R インスタンス

HDP

アップデート

Reference