問題タブ [plyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:2つの列の類似性チェックに基づいて列を削除します
入力
行1と2と3を削除するルールがあります。これは、行1、2、3のcolumn2とcolumn3は同じですが、矛盾するデータ(up
と down
)が列4にあるためです。
Rに、column2とcolumn3で同じ名前の行を削除するように依頼できますが、列3を縮小して、次のような行列を作成できます。
r - ddply を使用した要約統計
ddply
の 2 つの列の名前に基づいて要約統計を出力する関数を作成するのが好きですdata.frame
mat
。
mat
data.frame
列の名前を持つ大きなです"metric", "length", "species", "tree", ...,"index"
index
は2水準の因数です"Short", "Long"
"metric", "length", "species", "tree"
その他はすべて連続変数
関数:
呼び出した後、出力は次のようになると思いますsummary1("metric","length")
現時点では、関数は目的の出力を生成しませんか? ここでどのような変更を行う必要がありますか?
ご協力いただきありがとうございます。
おもちゃの例はこちら
r - Rの共通列の2つのデータフレームを他の合計とマージするにはどうすればよいですか?
Rバージョン2.11.1Windows7の32ビット
data_Aとdata_Bの2つのデータセットを取得しました。
data_A
data_B
ここで、USER_AとUSER_Bが等しい場合、data_BのACTIONをdata_Aに追加します。上記の例のように、結果は次のようになります。
data_A
では、どうすればそれを達成できますか?
r - ddplyを使用した連続サブグループ
条件が変わるたびに実験データをまとめたいと思います。
例えば:
これを次のように要約したいと思います。
このようにddplyを使用する場合:
library(plyr)
ddply(df、c( "temp")、summary、reponse.mean = mean(response)
出力は次のとおりです。
これを達成する方法はありますか?
r - R Plyr - DDPLY からの注文結果?
ddply の集計操作から得られる結果を並べ替えるための巧妙な方法を知っている人はいますか?
これは、深さの降順で出力を並べ替えるために私が行っていることです。
出力で...
それほど醜いわけではありませんが、ddply() 内でうまく行う方法を望んでいます。誰でも方法を知っていますか?
Hadley の ggplot2 book には、ddply とサブセットのこの例がありますが、実際には出力を並べ替えているわけではなく、グループごとに最小の 2 つのダイヤモンドを選択しているだけです。
r - ddplyで新しい変数を作成するためのループ
ddplyを使用してデータフレーム変数を集計および要約しています。データフレームのリストをループして新しい変数を作成することに興味があります。
ddplyにループを挿入して、新しいサマリー変数を書き出さないようにする方法はありますか。
これが実際に行われる方法ではないことは知っていますが、私はそれをどのように概念化するかを示したかっただけです。ddplyで呼び出す関数で、またはリストを介してこれを行う方法はありますか?
更新:私は新しいユーザーなので、自分の質問に対する回答を投稿することはできません。
私の答えには、ニックの答えとイスタのコメントからのアイデアが含まれています。
r - 各グループの上位 n 行でデータ フレームをサブセット化し、変数で並べ替える
変数でグループ化され、別の変数で降順にソートされている n 行のデータ フレームをサブセット化したいと思います。これは、次の例で明らかです。
性別ごとに、年齢で降順に並べ替えられた2行を取得したいと思います。望ましい出力は次のとおりです。
ここで順序、並べ替え、およびその他の解決策を探しましたが、この問題に対する適切な解決策が見つかりませんでした。私はあなたの助けに感謝します。
r - Rでリストを圧縮する
ガイドラインとして、明示的に反復するのではなく、lapplyまたは* ply(plyrから)を使用してリストの要素に関数を適用することをお勧めします。ただし、これは、一度に1つのリストを処理する必要がある場合にうまく機能します。関数が複数の引数を取る場合、私は通常、サイクルを実行します。
私は、よりクリーンな構造を持ちながら、本質的に機能することが可能かどうか疑問に思いました。考えられるアプローチの1つは、Pythonのような関数zip(x、y)を定義することです。これは、入力リストを受け取り、i番目の要素がlist(x、y)であるリストを返し、その関数をに適用します。このリスト。しかし、私の質問は、私が最もクリーンなアプローチを使用しているかどうかです。私はパフォーマンスの最適化について心配していませんが、むしろ明快さ/優雅さについて心配しています。
以下は素朴な例です。
そして、これがzip形式の例です(任意の引数に拡張できます):
r - dlply引数で関数を呼び出す方法は?
dlply
で層別化された線形回帰を適合させるために使用する関数を書きたいと思います
だから私の関数はこのようになります
関数を呼び出したときにfun1("cat2")
関数が実行されるように関数を作成する方法
そして関数を呼び出すとfun1("cat3")
、関数が実行されます
ここでcat1
、cat2
とcat3
はカテゴリ変数の名前です。
ご協力ありがとうございました。
編集:現時点では機能が立っているため、".(cat1,arg1)"
で「認識」されていないため、正しく機能しませんdlply
。いくつかの変更が必要ですが、どのように?
r - plyrは、同じ名前で異なる値を持つ異なるdata.framesの2つの列をどのようにマージしますか?
ライブラリを使用して 3 つの data.frames をマージしてplyr
いるときに、同じ名前のいくつかの値に遭遇しますが、異なる data.frames にそれぞれ異なる値があります。
はこの問題をどのようにdo.call(rbind.fill,list)
扱いますか: 算術平均または幾何平均?