問題タブ [split-apply-combine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R のデータ フレーム内の各年の両性具有の名前と合計金額をグループ化します。
「年」「名前」「性別」「金額」というタイトルの4つの列を持つデータフレームがあります。サンプルデータセットはこちら
'm' と 'f' の両方で出現する名前だけを見つけて、各年の金額を合計したいと考えています。
どんな助けでも大歓迎です
r - R を使用したデータの再構築
次のようなデータセット (dat) があります。
これは、特定の期間にわたって Web サイトにログインした個人のインスタンスを反映しています。次のようなデータが必要です。
そのため、同じ人物の複数のエントリではなく、個人ごとに 1 つの行だけがあり、ログイン回数がカウントされます。
また、私の例では、36598035 という人物が複数の IP アドレスでログインしていることに気付くでしょう。これが発生した場合、最終的なデータセットの IP アドレスにモード IP アドレス、つまり個人が最も頻繁にログインした IP アドレスを反映させたいと考えています。
r - 集計を使用してデータ フレームの各列に複数の関数を適用する
複数の関数を複数の列に順次適用し、複数の列で集計する必要があり、結果をデータ フレームにバインドする必要がある場合は、通常aggregate()
、次の方法で使用します。
きれいに並べられたデータ フレームで結果を取得するには、次を使用します。
このシナリオで smarterdo.call()
を使用して呼び出しを回避したり、最初から別の基本ソリューションを使用してプロセス全体を短縮したりできますか?aggregate()
R
r - dplyr の group_by を使用して、split-apply-combine を実行します
私は次のことdplyr
を行うために使用しようとしています:
Petal.Lengths を Speicies で分割し、関数を適用します。この場合、shapiro.test.
このSO の質問と他のかなりの数のページを読みます。次を使用して、変数をグループに分割することができますdo
。
グループへの列の「分割」が機能しているようです。しかし、断片を shapiro.test に渡す方法はまだわかりません。に分割するgroup_by
のとは違うと思います。
次のような多くのバリエーションを試しました。
そしてまた
各種の Petal.Lengths に対して 1 回、3 回dplyr
実行するにはどうすればよいですか?shapiro.test()
r - データ内のサブセットからのランダム サンプルの繰り返し
私は R の初心者であり、シンプルな for ループ プロセスでレンガの壁にぶつかっています。データは、81161 x 9 の次元のリストで構成されています。観察は、経時的な個人のものです。現在の必要性は、観測の一意のグループを分離し、観測データ ポイントの 1 つをランダムに抽出することです。この段階で、実行されていないいくつかのオプションを確認して試しています。最初に for ループを適用します。
私が概説したワークフローのより良いアイデアを提供するために。これは、比較的単純な分割 - 適用 - 結合でなければなりません。適用は、一意の individual_days に制限されたサンプルです。これを行うために、コードはすべてのディメンションの基本的な定義を経てから、一意の値、並べ替えとランクを定義します (ここから、一意の individual_day が序数スケールに設定され、次に、これらは individual_day を使用して originsl データにリンクされます)。キーとして)。この時点から、for ループで 2 つの代替案を試みました --- 最初にランクによる分割を使用して DSrank$'1, 2, 3...n' (例 2 で使用しようとしました) を提供し、見られるサブセットを使用します例 1 では、単一のサンプルがランダムに抽出され、サブデータセットに照合されます。この時点から、他の分析が実行されます。
これらは、CRAN、stackoverflow、およびその他の R コード検索結果から見つけた例に基づいています。
共有できる提案、ヒント、またはトリックがあれば、大歓迎です。
MB