問題タブ [plyr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rでベクトルの要素を繰り返します
ベクトルa、bの要素を何度も繰り返そうとしています。つまり、y = 2の場合、a="abc"は"aabbcc"である必要があります。
次のコード例のいずれも機能しないのはなぜですか?
そしてplyrパッケージから、
私は私が非常に明白な何かを逃していることを知っています...
r - ddplyを使用してグループごとにデータをサブサンプルするにはどうすればよいですか?
行が多すぎて空間コレログラムを実行できないデータフレームがあります。代わりに、種ごとに40行を取得し、そのサブセットでコレログラムを実行します。
データフレームをサブセット化する関数を次のように記述しました。
ここで、この関数をより大きなデータフレームの各種に適用したいと思います。
私が何かをしようとすると
このエラーが発生します:
誰かがこれを行う方法についてのアイデアを持っていますか?
r - データフレームを係数値でサブセットに分割し、glm クラスを返す関数に送信し、再結合する方法は?
Hadley の plyr パッケージ ddply 関数のおかげで、データフレームを取得し、それを要因別にサブデータフレームに分割し、それぞれを関数に送信してから、各サブデータフレームの関数結果を新しいデータフレームに結合できます。
しかし、関数が glm のようなクラスのオブジェクトを返す場合、または私の場合は ac("glm", "lm") の場合はどうなるでしょうか。では、これらをデータフレームに結合することはできませんか? 代わりにこのエラーが発生します
関数呼び出しのすべての複雑な glm クラスの結果に対応し、データフレームのサブセットに関する情報を保持する、より柔軟なデータ構造はありますか?
それとも、これはまったく別の方法で行う必要がありますか?
r - 関数内で ddply を実行すると、関数外の環境が見えますか?
頻繁に繰り返される分析を実行する関数を作成しようとしていますが、その一部は、グループの数と各グループ内のメンバーの数をカウントすることです。そのため、ddply を使用して救助します!しかし、私のコードには問題があります。 ...
ここにいくつかのサンプルデータがあります
ここに私のコードがあります
この関数を実行すると、エラーが発生します
ただし、最初にグローバル環境で exp1、exp2、およびデータ変数を定義すると、機能します
だから、私は ddply が関数の環境外で実行されていると思いますか? これを止める方法はありますか、それとも何か間違っていますか?
ありがとう
ポール。
r - ddplyを使用したグループIDの割り当て
R初心者からのかなり基本的なパフォーマンスの質問。フィールドの一意の組み合わせによって、データフレームの各行にグループIDを割り当てたいと思います。これが私の現在のアプローチです:
これは、行が比較的少ない、またはグループの数が少ないデータフレームではうまく機能しますが、一意のグループが多数ある大きなデータセット(100,000行を超える)ではパフォーマンスの問題が発生します。
このタスクの速度を向上させるための提案はありますか?おそらくplyrの実験的なidata.frame()で?それとも私はこれについてすべて間違っていますか?
よろしくお願いします。
r - 生成された列をddplyで再利用することは可能ですか?
次の例のように、ddplyを使用しているスクリプトがあります。
ddply内で、関数全体を再度呼び出さずにcol1を再利用することは可能ですか?
例えば:
xml - 不均一な階層リストをデータ フレームに変換する
これはまだ質問されていないと思いますが、複数のレベルと不均一な構造を持つリストの情報を「長い」形式のデータフレームに結合する方法はありますか?
具体的には:
構造は次のとおりです。
私が持ちたいのは、適切な ( top、atbat、bottom )とともに、ピッチカテゴリの名前付きベクトルからのデータ フレームです。したがって、列の数が異なるために data.frame に収まらないレベルを無視する必要があります。このようなもの:
これを行うエレガントな方法はありますか?ありがとう!
r - データフレームの列に基づいてデータの形状を変更する
次の形式でdata.frameを取得する必要があります。
の違いに基づいて重複行を生成しstart - end
ます。たとえば、最初の行に3行、2番目の行に1行、3番目の行に2行が必要です。開始フィールドと終了フィールドは、最終的なdata.frameで順番に並べる必要があります。このdata.frameの最終結果は次のようになります。
私は動作するこの関数を作成しましたが、非常にR'esqueコードで作成されていません:
このコードを最適化する方法について誰かが提案を持っていますか?適用できる機能はありplyr
ますか?
list - l_ply:リストのname属性を関数に渡す方法は?
次のようなRリストがあるとします。
を使用してリスト内の各data.frameを処理したいのですが、data.frameと一緒にl_ply
名前(例:aug9104AP)を処理関数に渡す必要もあります。何かのようなもの:
どうあるべきarg_to_access_current_list_item_name
ですか?
r - plyrの「summarise」関数はまだ存在しますか?
plyrを使用するとき、私はしばしば1)変数のサブセットのみに対して操作を実行し、2)操作の出力に名前を付けたいと思います。例えば:
しかし、これはちょっと不格好なようで、私は次のようなものを書くことができるはずです:
私が読んだことから、plyrに含まれているsummary関数があるように見えます(または以前はそうでしたか?)、それは私が書くことを可能にするでしょう:
しかし、summary関数を使おうとすると、Rはそれが存在しないことを教えてくれます。名前が変更されたか、別のパッケージに移動されましたか?Macでplyrバージョン0.1.5(最新だと思います-アップデートしてみました)を使用しています。