問題タブ [split-apply-combine]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
85 参照

python - 列ラベルに基づく DataFrame の結合

私は気象データを多くの個別のファイルに保存しています。列は特定の測定器用であり、各行は特定の日の平均値に対応しています。1 つのファイルが次のようになっているとします。

そして、このように見える秒、

これら 2 つをマージして、すべての計測器 (A、B、C、D など) をすべての測定期間とともに同じファイルに表示できるようにします。期待される結果は次のようになります。

これを取得するために、私は試しました:

ただし、共通の行インデックスがないため、マージする必要がある列が分割されていることがわかります。この機能は pandas に非常に便利な追加機能になると思います。これはできますか?

0 投票する
1 に答える
88 参照

r - R: 分割 - 適用 - 組み合わせて累積変数を取得

これは df の小さな担当者です。

チームごとに、最も古いゲームから最新のゲームまでの日付でさまざまなゲームをランク付けする新しい変数/列を作成したいと思います。

出力は次のようになります。

分割 - 適用 - 結合をランキング機能で考えましたが、うまくいきませんでした。

0 投票する
3 に答える
1408 参照

r - 同様の行全体で一定のRデータフレームで乱数を生成します

「ユーザー」ごとに X 行を含むデータフレームがあります。X はユーザー間で一定ではありません。私がやりたいことは、乱数を生成して新しい列を埋めることができるようにすることですが、「ユーザー」ごとに、乱数はそのユーザーに対応するすべての行で同じです。たとえば、データは次のようになります。

次のような新しい列を生成したいと思います。

私が行った最初のアプローチは基本的に使用することでしたs <- split(df, df$user)が、データフレームには膨大な数のユーザーが含まれており、これはおそらく非常に非効率的な方法だと思います.

どうもありがとう。

0 投票する
1 に答える
131 参照

r - 分割された `data.frame` を元の順序に結合します

data.frame元の順序が維持されるように、この分割を元に戻すにはどうすればよいですか?

私の実際のユースケースには、より複雑な機能が含まれます。係数で分割し、data.frameグループごとの変換を実行してから、元の順序で結合する必要があります。

0 投票する
2 に答える
197 参照

python - パンダのcombine_firstにより、行数が増えます

次のデータでは、「DATE」列の日付を前の日付 (DATE - 1 日) に変更する必要があります。CLOCKDATETIME 時間は「4:00」時間未満です。「4:00」時間未満の行を取得し、日付を変更して結果を入力と組み合わせることができるようになりましたが、入力 29 行のデータに対して目的の結果が得られません行数は同じままである41行として最終結果を取得しています。データ フレームを結合して目的の結果を得るにはどうすればよいですか (行数は入力行と同じままです)。

CSV 形式のサンプル データ:

以下は私が今持っているコードです:

0 投票する
1 に答える
87 参照

python - Python Pandas:関数が2番目のグループに適用されると、Split-apply-combine、可変長でエラーが発生しますか?

Python Pandas で Split-Apply-Combine パラダイムを利用しようとすると、いくつかの奇妙な動作に気付きました - 変数xが正しい長さになりません!

私が達成しようとしていることの概要:

  1. groupby() 操作を使用して、複数の会社のデータを含むデータフレームをグループに分割します (会社ごとに 1 つ)。
  2. 各グループの情報余剰を計算する
  3. 結果を含む新しいデータフレームを返す

最初のグループの計算は完璧です。ただし、2番目のグループでは、データフレームをスライスするときに前の変数の長さを継承しているようです-これはなぜですか? コードと提供されたデバッグからわかるように、私は問題を特定しようとしましたが、それを見ることができません。

関数呼び出し:

デバッグ (および問題):

最初のグループ:

2 番目のグループ:

これが問題です - 何らかの理由で の長さxが 78 に減り (1005 になるはずです!)、不思議なことに 1006 - 928 = 78 (最初のグループの長さ - 2 番目のグループの長さ)

コード:

分割適用結合方法

情報余剰方式(デバッグあり)

相互情報法