問題タブ [sparklyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - SparklyR を使用してインデックスで Spark データ フレームを並べ替えたい
Spark (sparklyr) DataFrame で dplyr を使用してインデックスで並べ替える方法を知っている人はいますか?
r - sparklyr で列のデータ型を factor に変更する
私はSparkを初めて使用し、現在sparklyパッケージを介してR APIを使用して使用しています。ハイブ クエリから Spark データ フレームを作成しました。dplyr
ソース テーブルでデータ型が正しく指定されていないため、パッケージの関数を利用してデータ型をリセットしようとしています。以下は私が試したコードです:
prod_dev が R データ フレームの場合、コードは機能します。ただし、Spark データ フレームで使用すると、正しい結果が得られないようです。
Spark データ フレームに必要な変更を加える方法を教えてください。
scala - ファイルからのグラフの読み取り
Hadoop/Spark の SparklyR インストールから Spark-Shell を使用して、Windows マシンで GraphX の例を実行しようとしています。ここで最初にインストール ディレクトリからシェルを起動できます。
出力:
次に、このデータとともに Cit-Hepth.txt
保存されたSPARK IN ACTION のテキスト例を使用して、例として次のように使用します。C:\Users\eyeOfTheStorm
val graph = GraphLoader.edgeListFile(sc, "Cit-HepTh.txt")
次に、Scala シェルから単純に実行すると、以下のエラーが発生します。HADOOP_HOME
は、正しい winutils がインストールされている SparklyR によって自動的に設定されることに注意してくださいC:\Users\eyeOfTheStorm\AppData\Local\rstudio\spark\Cache\spark-2.0.0-bin-hadoop2.7\tmp\hadoop
。以下のエラーを排除してコードを実行するコードまたはパスが欠落していませんか?
r - dplyr の動的 mutate_each
データフレームに次の列があります。
列 c# および c#_sum は動的です。私はすべてのC#でこのようなことをしようとしています:
最終結果は次のようになります。
必要な列のみを処理するために一致するものをすでに試しましたが、現在の列名を解析する方法がわかりません (c#_weight = (d * c#) / c#_sum)。
私はsparklyrを使用しているため、tidyrを使用できません!! dplyrのみを使用してそれを行う方法はありますか??
r - sparklyr でハイブ サポートを無効にする
sparklyr でハイブのサポートを無効にする方法はありますか?
SparkR と同じように:
r - SparklyR との接続エラー
SparklyRの簡単なガイドに従おうとしていますが、最初からエラーが発生します。ガイドに記載されているように、SparklyR とローカル バージョンの Spark をインストールします。
次に、接続を開くと、エラーが発生する場所は次のとおりです。
「Rコード実行エラー」と次のメッセージが表示されます。
ここに私のセッション情報があります:
何か不足していますか?ガイドに従う前に、何かする必要がありますか?