問題タブ [qubole]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pyspark - qubole の pyspark ジョブが「例外読み取りマッパー出力を再試行しています」で失敗する
次のエラーで失敗する qubole を介して実行されている pyspark ジョブがあります。
ジョブは次の構成で実行されます。
クラスタには 30 のスレーブ カウントが含まれます。m2.2xlarge
、4 コアのマスター ノードとスレーブ ノード。
問題の根本原因に関する洞察は役に立ちます。
hadoop - Qubole からローカル csv を Hive テーブルに挿入する
ローカル マシンに csv があり、Qubole Web コンソールから Hive にアクセスしています。csv を新しいテーブルとしてアップロードしようとしていますが、わかりませんでした。私は次のことを試しました:
エラーが表示されますNo files matching path file
csvは、ローカルマシンではなく、ハイブが実際に実行されているリモートサーバーにある必要があると推測しています。私が見た解決策は、この問題を処理する方法を説明していません。誰かがregを手伝ってくれませんか。これ?