問題タブ [data-science-experience]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
data-science-experience - SPARK_HOME または SPARK_HOME_VERSION からバージョンを検出できませんでした
DSX で RStudio の spark を使用するためのチュートリアルに従おうとしていますが、次のエラーが発生します。
上記のコード スニペットは、RStudio の [spark に接続] ダイアログから取得しました。
だから私は見てみましたSPARK_HOME
:
わかりました、ディレクトリが存在することを確認しましょう:
これが問題の原因だと思いますか?
注:スタックオーバーフローに関する同様の質問がいくつかありますが、いずれも IBM のデータ サイエンス エクスペリエンス (DSX) に関するものではありません。
更新 1:
私は次のことを試しました:
更新 2:
私のconfig.ymlからの抜粋。私には他にも多くのスパークサービスがあることに注意してください。最初のものを貼り付けただけです。
私のconfig.ymlは私のために生成されたことに注意してください。
更新 3:
私の .Rprofile は次のようになります。
私の .Rprofile は私のために生成されたことに注意してください。
更新 4:
sparklyr をアンインストールし、セッションを 2 回再起動しました。次に実行しようとしました:
ただし、上記のコマンドはハングしました。コマンドを停止し、sparklyr のバージョンを確認しましたが、問題ないようです。
data-science-experience - dsx ml パイプラインで非標準の区切り文字を含む入力ファイルを処理するには?
::
ヘッダーがなく、フィールド区切り記号があるデータセットを操作しようとしています:
出力:
::
ファイルを dsx パイプラインにロードしましたが、区切り記号を使用して dsx でこのファイルを分割する方法がわかりません。
どうすればいいですか?
dsx ml パイプライン機能を使用して dsx でこのファイルを再形成できない場合、dsx には入力ファイル形式に関する前提条件がありますか?
アップデート:
私が使用しようとしている ml パイプライン機能は、以下のスクリーンショットから確認できます。
データ セットを追加しましたが、dsx にフィールド区切り文字を認識させる方法がわかりません。