問題タブ [plyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Plyrエラーに関する質問:as.double(y)のエラー:タイプ「S4」をタイプ「double」のベクトルに強制できません
以前に作業していたプロジェクトをアップグレードしています。このコードは数か月前に機能しましたが、その間にRとplyrをアップグレードしました。私はR1.10を使用していたと思いますが、現在はR1.35を使用しています。以前に実行していたplyrのバージョンはわかりませんが、現在インストールされているバージョンは1.2です。
これが私が実行しようとしているものです:
今はいつも同じエラーメッセージが表示されます。
何かアドバイスをいただければ幸いです。
ありがとう、
ジェイソン
r - plyrサマライズはグローバル関数のみを呼び出します
関数 (weight.func) を、ddply を呼び出す別の関数 (ラッパー) に渡そうとしています。ddply でその関数 (weight.func) を計算の一部として使用するようにします。weight.func が「グローバル」に設定されている場合は必要な出力が得られますが、匿名関数としてラッパーに渡された場合は得られません。
ddply にやりたいことをさせることはできますか? コード例を次に示します。
2 番目の出力がゴールです。どんな助けでも大歓迎です!(同じタスクを達成するための非プライヤーベースの方法を含みます。)
上記の例はおもちゃの例です。これは、動作を再現できる最も単純なケースです。
r - plyr/ddply を意図したとおりに使用するように、このコードを書き直すにはどうすればよいですか?
バックグラウンド
統計的要約を計算したい確率分布のデータフレームがあります。
アプローチ
ステップ 1: 集計を計算して返す関数を作成しましたmean(lcl, ucl)
ステップ 2: データフレームに新しい列を追加したいと思います。stats
質問1:
これを行う適切な方法は何ですか?しようとするとエラーが発生する
質問 2: (追加単位)
関数をより効率的にコーディングする方法summary.stats
、つまり「if」を少なくする方法はありますか?
アップデート
これを解決してくれたシェーンとジョシュアに感謝します。
また、データフレームのすべての行で plyr 操作を実行しようとしている他の人に役立つはずの質問も見つけました
r - R: data.frame 列の不均衡なリストを分割します
次の構造のデータ フレームがあるとします。
ここで、列b
はセミコロンで区切られたリストです (行ごとにバランスが取れていません)。理想的な data.frame は次のようになります。
ほぼ 2 時間 (170K 行) かかる部分的なソリューションがあります。
サイズの問題のようです。
9秒しかかかりません。最初に sapply (別の関数を使用) を使用して一連の data.frames に変換するのは高速ですが、必要な「rbind」にはさらに時間がかかります。
r - n 関数のリストをデータフレームの各行に適用しますか?
関数のリストがあります
そして、私はデータフレームを持っています:
i行ごとに、j列ごとに関数jを評価し、結果を合計したいと思います。
これを効率的に行うにはどうすればよいですか?plyr
これは機能を実装する適切な機会ですか? もしそうなら、どのように?
おまけの質問: なぜa[4]
NA
ですか?
の関数を使用するのに適切な時期plyr
ですか?
function - sapply /plyr 構文に関する R の質問: 変数値を関数に渡す方法
関数 (x) 表記を使用せずに、ddply/sapply の変数値を関数に直接渡す方法はありますか?
例: ddply(bu,.(trial), function (x) print(x$tangle) ) の代わりに
方法はありますか: ddply(bu,.(trial), print(tangle) )
多くの変数があると、この表記法は非常に面倒になるので、私は尋ねています。
ありがとう!
r - グループ化変数が要因である場合、グループごとの要約統計量を生成するにはどうすればよいですか?
mtcars
データセット(ベースRバージョン2.12.1の一部)の要約統計量を取得したいとします。以下では、車をエンジンシリンダーの数に従ってグループ化し、の残りの変数のグループごとの平均を取りますmtcars
。
しかし、私のグループ化変数がたまたま要因である場合、物事はよりトリッキーになります。ddply()
ファクターを取得できないため、ファクターのレベルごとに警告をスローしますmean()
。
ですから、要約統計量を間違った方法で生成しようとしているのではないかと思います。
通常、因子別またはグループ別の要約統計量(平均、標準偏差など)のデータ構造をどのように生成しますか?他のものを使用する必要がありddply()
ますか?を使用できる場合ddply()
、グループ化係数の平均をとろうとしたときに発生するエラーを回避するにはどうすればよいですか?
r - 各行にライブラリ コマンドを適用し、新しい変数を作成する方法
ジニ係数を計算する ineq() ライブラリ内のコマンドを使用して新しい変数を作成するのに少し問題があります。ineq コマンドに与えるベクトルは、関心のある列のリストです。個々の行ごとにこのコマンドを実行し、新しい変数を追加したいと考えています。
これをループとして、または ddply (現在学習中) を使用して試行すると、出力は各行の (データセット全体の) 同じ Gini スコアになります。
個々の行ごとにこのコマンドを実行するにはどうすればよいですか? 前もって感謝します!