“split-apply-combine”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

298 参照

r - 2列のデータで分割、適用、結合

次のように、グループと2つの値列で構成されるデータフレームがあります。

サブセットで分割された val1 > val2 の行数を計算したいと思います。最初に、サブグループごとにこれを次のようにハードコーディングしました。

これを自動化する適切な方法は何ですか？関数を使用してみましたが、列と列split()の両方を渡す方法がわかりませんでした。val1val2

r split-apply-combine

2014-12-04T10:56:02.083

0 投票する

1 に答える

596 参照

r - R データフレームのグループに対する関数の適用

各被験者に対して個別に ANOVA を実行する必要があります。37 人の被験者からのデータで構成されるデータフレームがあり、37 回ループして各被験者で ANOVA を個別に 37 回実行したくありません。これらは私のデータの最初の 4 行です。

これは私のコードです:

しかし、エラーメッセージが表示されます:

unique() はベクトルにのみ適用されます

どんな助けでも感謝します

r split-apply-combine

2014-12-15T09:30:21.187

0 投票する

2 に答える

1100 参照

r - 文字ベクトルを別の列 r の値で折りたたむ

ある列に一連の文字列を含むデータフレームがあり、別の列にグループ化変数 (文字列ですが、要因になる可能性があります) があります。collapseグループ化変数によって文字列が要素に折りたたまれるようにデータフレームを作成したいと思います。参考までに、そのベクターを使用Corpus(VectorSource(x))します (つまり、折りたたんでドキュメントを作成します)。

たとえば、次のようになります。

これは、'W' のメンバーと 'F' のメンバーの 2 つの要素をもつ文字ベクトルに変換されます。私は使用できることを知っています：

それらをすべて取得するには、もちろん手動でサブセット (またはループ) を作成します。関数があるかどうか疑問に思っていましたがplyr(しかし、関数が表示されませんでした)、(ベースで) 探しているものだと思いますが、ここでどのように使用されるかは明確ではありませんtapply。by

ここでデータフレームを出力するつもりはありませんが、フラグ付きの重複を調査すると、これらの方法がこの質問に明確に適用されます。

r plyr tapply split-apply-combine

2015-01-23T13:43:37.597

0 投票する

2 に答える

406 参照

r - 可変変数に対してプログラムで group_by() を呼び出す

dplyr を使用して、[sic] を変更可能な変数で要約したいと思います (たとえば、ループまたは適用スタイルのコマンドで)。

名前を直接入力しても問題ありません。

ただしgroup_by、文字ベクトルを受け取るように作成されていないため、結果を渡すのは困難です。

私は1つの解決策を投稿しますが、他の人がこれをどのように解決したかを知りたいです.

r group-by dplyr split-apply-combine

2015-02-08T00:22:11.720

0 投票する

1 に答える

54 参照

python-2.7 - pandas - グループ内の参照レコードに対して計算を実行する

DataFrame 内のデータの各行について、列内の一意の値の数を計算し、その特定の行と、別の列で識別されるグループ内の参照行についてA計算したいと思います。おもちゃのデータセットは次のとおりです。BID

データは次のようになります。

ここで、を使用して定義された各グループ内で、各レコードを参照レコードと比較し、組み合わせの一意の数と値IDを計算したいと考えています。たとえば、データレコード 3 の値を計算するには、これを 3 にすると次のようになります。結果は次のようになります。ABlen(set([4,4,6,12]))

これを実装する唯一の方法は、グループ化された各オブジェクトをループし、次にグループ化されたオブジェクト内の各レコードをループし、参照レコードに対して計算する for ループを使用することです。これは非 Pythonic であり、非常に遅いです。誰かが同じことを達成するためのベクトル化されたアプローチを提案できますか?

python-2.7 pandas split-apply-combine

2015-02-19T01:08:15.810

0 投票する

3 に答える

2368 参照

r - 行の結合 - R で特定の列を合計し、他の列を合計しない

列 1 で名前が繰り返され、次に数値である他の 3 つの列を持つデータセットがあります。

繰り返される名前の行を1つの列に結合し、2つの列を合計して、もう1つの列をそのままにしたいと考えています。これを行う簡単な方法はありますか？私はsapplyとlapplyでそれを理解しようとしてきましたが、ここで多くのQ&Aを読みましたが、解決策が見つからないようです

データは次のようになります。

私はそれを次のようにしたいと思います (列 3 と 4 を合計し、列 1 だけを残します。次のようにしたいと思います:

どんな助けでも素晴らしいでしょう。ありがとう！

r split-apply-combine

2015-03-18T18:49:25.413

0 投票する

1 に答える

201 参照

datatable - Juliaでsplit-apply-combineメソッドに「参加」する方法

Juliaで実行したい（SQLの意味で）やや複雑な結合がありますが、分割-適用-結合メソッドでそれを機能させる方法がわかりません（手動で書き出すことはできますが））。ただし、これは簡単に行う必要があるようです。問題はこんな感じ。レースを実行しているタートルに関するデータの DataFrame があります。

このテーブルの行だけで構成されるデータテーブルが欲しいのですが、これは各タートルの個人的な (タートルナル?) 実行されたイベントで最高のものです。必要なものはほぼ手に入る

しかし、一致する行の写真列も必要です。どうすればいいですか？

datatable julia split-apply-combine

2015-04-09T20:57:16.497

0 投票する

4 に答える

158 参照

r - R: forloop を使用しない大きな data.frame のサブセット化と順序付け

97M 行の長いテーブルがあります。各行には、ユーザーが実行したアクションの情報とそのアクションのタイムスタンプが次の形式で含まれます。

各アクションは、人によって実行されるか実行されない可能性があり、アクションはどのような順序で実行されてもかまいません。

データセットの一連のアクションを要約することに興味があります。特に、各人について、1 番目、2 番目、3 番目、4 番目に実行されたアクションを見つけたいと考えています。アクションが複数回実行された場合、最初に発生したアクションのみに関心があります。それから誰かが走って、食べて、食べて、走って、寝たらrun、、eat、などの要約に興味がありsleepます。

forloop で必要なものを取得できます。

この結果は、より効率的な方法でループなしでも取得できますか?

r for-loop data.table dplyr split-apply-combine

2015-05-13T16:08:56.363

問題タブ [split-apply-combine]

Reference