問題タブ [sparkr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - sparkR でエントリ日付を削除する
DataFrame x があります。ID と日付が含まれます。そう
ID = 1 2 ... および Date = "2012-05-05" "2015-01-01" ... を与える
「2013-01-01」+ P より後の日付を持つすべての ID が削除された新しいデータセットを作成したいと考えています。P は日です。たとえば、P = 3 日です。
sparkRではこれを行います
しかし、sparkR はこれを受け入れません。
r - sparkR で DataFrame を収集するには
sparkR に 100 個の DataFrame があります。
それらを新しい DataFrame に集めたいと思います。これを行う1つの方法はこの方法です
現在、「all」は DataFrame であり、これらの他の DataFrame が 100 個含まれています。これをSparkRで実行するには時間がかかりますが、これを行うためのより良い方法があるのだろうか?
r - SparkR の 'last' 関数
私はDataFrame Xを持っています.sparkRでは、入力して最初の行を見つけることができます
今、私は最後のものを見つけたいと思っています。「last」は集計関数です。
しかし、sparkR で last(X) と入力すると、このメッセージが表示されます (関数 (クラス、fdef、mtable) でエラーが発生しました: 署名 '"DataFrame"' の関数 'last' の継承されたメソッドが見つかりません。これを解決できますか?
さらに、 head(X) を実行して最初の行を取得できますが、 X の最後の行を取得するにはどうすればよいですか?
r - sparkR のカウント関数の実行時間
sparkR に DataFrame X があります。X には、ID = 1 2 3 1 2 3 9 ... の列と、各エントリのスコア: スコア = 1241 233 20100 ... が含まれます。
したがって、ID のすべてのスコアを見つけるには
次に、合計を取ることができる ID 1 のすべてのスコアを取得します。
XでID=1の数を知りたいのでSparkRのcount関数を使う
しかし、これは計算に非常に時間がかかります。これを行うより良い方法はありますか?
ID = 1 1 1 2 3 3 3 4 ..... のように X を配置またはソートしたと仮定すると、 count(s) を実行しないようにするためのより良い代替手段があるかもしれません。
sparkr - R と sparkR で max-ppsize を変更する
IR と sparkR 'max-ppsize' を変更したい。
https://cran.r-project.org/doc/manuals/r-release/R-intro.pdf ページ 93/105 コマンドの説明があります。
Ubuntu で R または sparkR プログラムを開いたときに、どのように正確に入力すればよいですか? 他の場所で明確な説明を見つけることができませんでした。
How to set max ppsize in R?の回答を見てきました 。
R では正常に実行できますが、SparkR では実行できません。
このようにubuntuでsparkRを起動します
そして、私はタイプします
しかし、エラーメッセージが表示されます:「log4j Warn No appenders could be found for logger」