問題タブ [pandas-groupby]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
9947 参照

python - Pandas Dataframe:他の列に出現回数のある列を追加する方法

私はdfに従う必要があります:

私は手に入れたい

私は使用しようとしました:

しかし、それは役に立ちませんでした。「NaN」でいっぱいのOccur列があります

0 投票する
4 に答える
5802 参照

python - パンダのローリングが一次元のndarrayを使用するのはなぜですか

pandasrolling機能を使用してローリング多要素回帰を実行することにしました (この質問は、ローリング多要素回帰に関するものではありません)。applya の後に使用しdf.rolling(2)て、結果pd.DataFrameの抽出を ndarray で取得し.values、必要な行列乗算を実行できると期待していました。それはうまくいきませんでした。

これが私が見つけたものです:

オブジェクトはどのように見えますか:

行列の乗算は正常に動作します。

apply を使用して行ごとの内積を実行すると、期待どおりに動作します。

Groupby -> Apply は、期待どおりに動作します。

しかし、私が実行すると:

私は得る:

AttributeError: 'numpy.ndarray' オブジェクトに属性 'values' がありません

わかりました、パンダはndarrayそのrolling実装内でまっすぐに使用しています。私はそれを扱うことができます。.valuesを使用して を取得する代わりに、ndarray次を試してみましょう。

形状 (1,) と (2,1) が整列していない: 1 (dim 0) != 2 (dim 0)

待って!何?!

そこで、ローリングが何をしているかを調べるカスタム関数を作成しました。

次に実行しました:

私の結果pd.DataFrameは同じです、それは良いです。しかし、10 個の 1 次元ndarrayオブジェクトが出力されました。どうですかrolling(2)

同じこと、出力を期待しますが、8 つndarrayのオブジェクトを出力しました。 私が期待していた形状とは対照的に、各列の長さrollingの単一次元を生成しています。ndarraywindowndarray(window, len(df.columns))

質問はなぜですか?

ローリング多因子回帰を簡単に実行する方法がありません。

0 投票する
3 に答える
40486 参照

python - 列を削除するパンダグループ

グループ平均を比較しようとして、操作ごとに単純なグループを実行しています。以下に示すように、欠損値がすべて削除された大きなデータフレームから特定の列を選択しました。

選択された列と df ヘッド

しかし、グループ化すると、いくつかの列が失われます。

group-by ロジックと結果の df

パンダでこれに遭遇したことは一度もありません。スタックオーバーフローでこれほど似ているものは他にありません。誰か洞察力がありますか?

0 投票する
2 に答える
9738 参照

python - Pandas - groupby で頻度として値を取得する

誰かが pandas の (可能な) groupby を手伝ってくれませんか?

ここにdfがあります:

次に、ドナーごとにグループ化されたカウントの合計の頻度として各カウントが必要です。

お気に入り:

次に、元のデータ フレームの各カウントが、easy_donor 列と一致する場合、groupby の合計で除算されます。元のデータフレームに参加する必要がありますか?

0 投票する
1 に答える
111 参照

python - x 人以上のメンバーを持つグループを選択

グループ化されたデータフレームから、x を超えるメンバーを持つグループを選択する方法はありますか?

何かのようなもの:

ドキュメントまたはSOで解決策が見つかりません。

0 投票する
2 に答える
21870 参照

python - python pandasで文字列を連結するためにgroupbyを使用する方法は?

現在、上部にデータフレームがあります。groupby 関数を使用して別のデータフレームを取得し、データをグループ化し、単語を次のような形式に連結する方法はありますか?

ありがとう

[画像の説明を入力 [1]