問題タブ [data-science-experience]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2027 参照

data-science-experience - SPARK_HOME または SPARK_HOME_VERSION からバージョンを検出できませんでした

DSX で RStudio の spark を使用するためのチュートリアルに従おうとしていますが、次のエラーが発生します。

上記のコード スニペットは、RStudio の [spark に接続] ダイアログから取得しました。

ここに画像の説明を入力

だから私は見てみましたSPARK_HOME

わかりました、ディレクトリが存在することを確認しましょう:

これが問題の原因だと思いますか?


注:スタックオーバーフローに関する同様の質問がいくつかありますが、いずれも IBM のデータ サイエンス エクスペリエンス (DSX) に関するものではありません。

更新 1:

私は次のことを試しました:

更新 2:

私のconfig.ymlからの抜粋。私には他にも多くのスパークサービスがあることに注意してください。最初のものを貼り付けただけです。

私のconfig.ymlは私のために生成されたことに注意してください。

更新 3:

私の .Rprofile は次のようになります。

私の .Rprofile は私のために生成されたことに注意してください。

更新 4:

sparklyr をアンインストールし、セッションを 2 回再起動しました。次に実行しようとしました:

ただし、上記のコマンドはハングしました。コマンドを停止し、sparklyr のバージョンを確認しましたが、問題ないようです。

0 投票する
1 に答える
117 参照

data-science-experience - dsx ml パイプラインで非標準の区切り文字を含む入力ファイルを処理するには?

::ヘッダーがなく、フィールド区切り記号があるデータセットを操作しようとしています:

出力:

::ファイルを dsx パイプラインにロードしましたが、区切り記号を使用して dsx でこのファイルを分割する方法がわかりません。

  • どうすればいいですか?

  • dsx ml パイプライン機能を使用して dsx でこのファイルを再形成できない場合、dsx には入力ファイル形式に関する前提条件がありますか?

アップデート:

私が使用しようとしている ml パイプライン機能は、以下のスクリーンショットから確認できます。

ここに画像の説明を入力

データ セットを追加しましたが、dsx にフィールド区切り文字を認識させる方法がわかりません。

ここに画像の説明を入力