“pandas-groupby”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1563 参照

python - pandas DataFrame から最後の有効な (null 以外の) 値を返す

dataframe次のような外観があるとします。

「b」でグループを作成できます。各グループの 'a' の最後の非 NA 値をすばやく取得する方法はありますか? この場合、グループ A では 3、グループ B では -9 になります。

(この場合、系列「a」は指定どおりにソートされますが、そうでない場合もあります。別の列「c」が存在する可能性があり、それに応じて「最後」が定義されます。)

grouped.groups dict を調べて、独自のループコードを作成しました。しかし、私の巨大なデータセットを考えると、どうやらそれは非常に非効率的です。これは非常に簡単に実行できると思います-おそらく私はパンダの初心者です:-)

2012-04-17T20:03:13.593

0 投票する

10 に答える

855120 参照

python - PandasGroupBy出力をSeriesからDataFrameに変換する

私はこのような入力データから始めています

印刷すると次のように表示されます。

グループ化は非常に簡単です。

印刷するとGroupByオブジェクトが生成されます。

しかし、最終的に必要なのは、GroupByオブジェクトのすべての行を含む別のDataFrameオブジェクトです。言い換えれば、私は次の結果を得たいと思います：

パンダのドキュメントでは、これを実現する方法がよくわかりません。ヒントは大歓迎です。

python pandas dataframe pandas-groupby multi-index

2012-04-29T16:10:35.413

0 投票する

3 に答える

155930 参照

python - pandas GroupBy.agg（）を使用した同じ列の複数の集計

複数回呼び出すことなく、2つの異なる集計関数f1, f2を同じ列に適用するパンダ組み込みの方法はありますか？df["returns"]agg()

データフレームの例：

構文的には間違っていますが、直感的に正しい方法は次のとおりです。

明らかに、Pythonは重複キーを許可していません。入力を表現する他の方法はありますagg()か？おそらく、タプルのリストは[(column, function)]、同じ列に複数の関数を適用できるようにするために、より適切に機能しますか？しかしagg()、それは辞書しか受け入れないようです。

内部の両方の関数を適用するだけの補助関数を定義する以外に、これに対する回避策はありますか？（とにかく、これは集約でどのように機能しますか？）

python pandas dataframe aggregate pandas-groupby

2012-09-25T19:05:26.550

0 投票する

3 に答える

38479 参照

python - DataFrame内で重複した列を結合します

同じ名前の列を持つデータフレームがある場合、同じ名前の列をある種の関数（つまり合計）と組み合わせる方法はありますか？

たとえば、次のようになります。

列名が同じである各行を合計して、NY-WEB01列（NY-WEB01だけでなく、重複する列がたくさんある）を折りたたむにはどうすればよいですか？

python pandas dataframe group-by pandas-groupby

2012-10-25T23:19:21.707

0 投票する

3 に答える

154 参照

python - たとえば、並べ替える必要があるタプルの長いリストがあります。[('12/2010', 196.9876),('12/2010', 654.9876), ('11/2010', 234.9876)........]

たとえば、並べ替える必要があるタプルの長いリストがあります。[('11/2010', 196.9876),('11/2010', 654.9876), ('12/2010', 234.9876).........]

日付 (1 番目の要素) を使用して、タプルの 2 番目の要素を個別のリストにグループ化したいと考えています。これまでのところ、一意の日付のリストを取得しており、[11/2010,12/2010....]これらを使用してより大きなリストを参照し、計算を実行しようとしています。

これは本当にくだらないコードかもしれませんが、私はコーディングが初めてで、これをやろうとして非常にイライラしています。提供された助けに感謝します。

PS私はPythonを使用しています

python list tuples pandas-groupby

2012-12-12T12:16:27.950

0 投票する

5 に答える

104793 参照

python - Python-GroupByオブジェクトのローリング関数

groupedタイプの時系列オブジェクトがあり<pandas.core.groupby.SeriesGroupBy object at 0x03F1A9F0>ます。grouped.sum()目的の結果が得られますが、rolling_sumをgroupbyオブジェクトで機能させることができません。groupbyローリング関数をオブジェクトに適用する方法はありますか？例えば：

しかし、私は次のようなものが欲しいです：

python pandas pandas-groupby rolling-computation rolling-sum

user1642513

2012-12-21T19:49:00.067

0 投票する

4 に答える

19482 参照

python - 値をgroupby手段で置き換える

さまざまな負の値を持ついくつかの不良データを含む列を持つDataFrameがあります。0未満の値をそれらが含まれるグループの平均に置き換えたいと思います。

NAとして欠落している値については、次のようにします。

しかし、次のような条件でこの操作を行うにはどうすればよいx < 0ですか？

ありがとう！

python pandas pandas-groupby

2013-02-07T20:51:01.330

0 投票する

1 に答える

1722 参照

python - パンダは時系列を複数列のデータフレームに変換します

以下のような日中のデータの時系列があります

列を各日付、行を日付の時刻として、データを DataFrame に変換したいと考えています。

これらを試してみましたが、

しかし、グループを日付列の DataFrame に変換するにはどうすればよいですか? または何か良い方法はありますか？

python pandas dataframe pandas-groupby

2013-02-16T05:40:53.390

0 投票する

10 に答える

179150 参照

python - GroupBypandasDataFrameと最も一般的な値を選択します

3つの文字列列を持つデータフレームがあります。最初の2つのすべての組み合わせに対して、3番目の列の1つの値だけが有効であることを私は知っています。データをクリーンアップするには、最初の2列でデータフレームごとにグループ化し、組み合わせごとに3番目の列の最も一般的な値を選択する必要があります。

私のコード：

コードの最後の行が機能せず、「キーエラー'短い名前'」と表示され、都市のみでグループ化しようとすると、AssertionErrorが発生します。どうすれば修正できますか？

python pandas group-by pandas-groupby mode

2013-03-05T11:34:38.150

問題タブ [pandas-groupby]

Reference