問題タブ [split-apply-combine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
77 参照

r - R のデータ フレーム内の各年の両性具有の名前と合計金額をグループ化します。

「年」「名前」「性別」「金額」というタイトルの4つの列を持つデータフレームがあります。サンプルデータセットはこちら

'm' と 'f' の両方で出現する名前だけを見つけて、各年の金額を合計したいと考えています。

どんな助けでも大歓迎です

0 投票する
3 に答える
100 参照

r - R を使用したデータの再構築

次のようなデータセット (dat) があります。

これは、特定の期間にわたって Web サイトにログインした個人のインスタンスを反映しています。次のようなデータが必要です。

そのため、同じ人物の複数のエントリではなく、個人ごとに 1 つの行だけがあり、ログイン回数がカウントされます。

また、私の例では、36598035 という人物が複数の IP アドレスでログインしていることに気付くでしょう。これが発生した場合、最終的なデータセットの IP アドレスにモード IP アドレス、つまり個人が最も頻繁にログインした IP アドレスを反映させたいと考えています。

0 投票する
2 に答える
1154 参照

r - 集計を使用してデータ フレームの各列に複数の関数を適用する

複数の関数を複数の列に順次適用し、複数の列で集計する必要があり、結果をデータ フレームにバインドする必要がある場合は、通常aggregate()、次の方法で使用します。

きれいに並べられたデータ フレームで結果を取得するには、次を使用します。

このシナリオで smarterdo.call()を使用して呼び出しを回避したり、最初から別の基本ソリューションを使用してプロセス全体を短縮したりできますか?aggregate()R

0 投票する
2 に答える
4096 参照

r - dplyr の group_by を使用して、split-apply-combine を実行します

私は次のことdplyrを行うために使用しようとしています:

Petal.Lengths を Speicies で分割し、関数を適用します。この場合、shapiro.test.このSO の質問と他のかなりの数のページを読みます。次を使用して、変数をグループに分割することができますdo

グループへの列の「分割」が機能しているようです。しかし、断片を shapiro.test に渡す方法はまだわかりません。に分割するgroup_byのとは違うと思います。

次のような多くのバリエーションを試しました。

そしてまた

各種の Petal.Lengths に対して 1 回、3 回dplyr実行するにはどうすればよいですか?shapiro.test()

0 投票する
0 に答える
94 参照

r - データ内のサブセットからのランダム サンプルの繰り返し

私は R の初心者であり、シンプルな for ループ プロセスでレンガの壁にぶつかっています。データは、81161 x 9 の次元のリストで構成されています。観察は、経時的な個人のものです。現在の必要性は、観測の一意のグループを分離し、観測データ ポイントの 1 つをランダムに抽出することです。この段階で、実行されていないいくつかのオプションを確認して試しています。最初に for ループを適用します。

私が概説したワークフローのより良いアイデアを提供するために。これは、比較的単純な分割 - 適用 - 結合でなければなりません。適用は、一意の individual_days に制限されたサンプルです。これを行うために、コードはすべてのディメンションの基本的な定義を経てから、一意の値、並べ替えとランクを定義します (ここから、一意の individual_day が序数スケールに設定され、次に、これらは individual_day を使用して originsl データにリンクされます)。キーとして)。この時点から、for ループで 2 つの代替案を試みました --- 最初にランクによる分割を使用して DSrank$'1, 2, 3...n' (例 2 で使用しようとしました) を提供し、見られるサブセットを使用します例 1 では、単一のサンプルがランダムに抽出され、サブデータセットに照合されます。この時点から、他の分析が実行されます。

これらは、CRAN、stackoverflow、およびその他の R コード検索結果から見つけた例に基づいています。

共有できる提案、ヒント、またはトリックがあれば、大歓迎です。

MB