問題タブ [pandas-groupby]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
16202 参照

python - Python pandas の Groupby: Fast Way

groupbyPython pandasの a の時間を改善したい。私はこのコードを持っています:

目的は、顧客が月に何件の契約を結んでいるかを数え、この情報を新しい列 ( Nbcontrats) に追加することです。

  • Client: クライアントコード
  • Month:データ抽出月
  • Contrat:契約番号

タイムを上げたい。以下では、実際のデータのサブセットのみを使用しています。

実行時間を改善するにはどうすればよいですか?

0 投票する
1 に答える
24705 参照

python - パンダで年齢分布をプロットする方法

年齢と性別の 2 つの列を含むデータ フレームがあります。

性別ごとに年齢分布をプロットするにはどうすればよいですか?

0 投票する
2 に答える
60167 参照

python - Pandas: 複数の時系列 DataFrame を単一のプロットにプロットする

次の pandas DataFrame があります。

min=1これは、からまでの複数の時系列クエリ データを含むデータフレームmax=35です。それぞれGroupこんな時系列です。

個々の時系列 A から Z までを 1 から 35 の x 軸に対してプロットしたいと思います。y 軸はblocks毎回になります。

各シリーズを互いにプロットするAndrews Curves plotのようなものを使用することを考えていました。各「色相」は異なるグループに設定されます。(他のアイデアも歓迎します。)

ここに画像の説明を入力

私の問題:このデータフレームをどのようにフォーマットして、複数のシリーズをプロットしますか? 列は 、 などにする必要がありますGroupAGroupB?

データフレームを次の形式にする方法:

示されているように、これは Andrews プロットの正しい形式ですか?

編集

私が試してみると:

x 軸は完全に間違っています。すべての時系列は、すべて 1 つの系列で 0 から 35 までプロットする必要があります。

ここに画像の説明を入力

これを解決するにはどうすればよいですか?

0 投票する
1 に答える
622 参照

python - パンダの前のグループの最小値/最大値

Pandas には、次のようなデータセットがあります。

最初に、データを日付でグループ化し、各グループの最大値を新しい列に保存したかったので、このタスクには次のコードを使用しました。

ここで、以前のグループの最大値を格納する別の列を作成したいので、目的のデータ フレームは次のようになります。

したがって、前の行の値を単純に取得するには、次を使用しました

別のグループの最小/最大/f(x) を取得する方法はありますか? 私は仮定した

しかし、うまくいきませんでした。

0 投票する
4 に答える
793389 参照

python - Pandas でグループごとに一意の値をカウントする

IDすべての一意の値をカウントする必要がありますdomain

私はデータを持っています:

私は試しますdf.groupby(['domain', 'ID']).count()

でも手に入れたい

0 投票する
3 に答える
2892 参照

python-2.7 - Pandas: 空の行に基づいてデータ フレームを分割する

次のデータフレームがあります。

5,6 などの空の行のセットごとに、新しいデータ フレームを作成します。複数のデータ フレームを生成する必要があります。以下に示すように:

0 投票する
2 に答える
12338 参照

python-3.x - パンダでグループ化、転置、追加しますか?

次のようなデータフレームがあります。

ここに画像の説明を入力

各ユーザーには 10 個のレコードがあります。今、次のようなデータフレームを作成したいと思います。

つまり、列の 10 レコードごとに反転nameし、新しいデータフレームに追加する必要があります。

それで、それはどのように行うのですか?パンダでそれを行う方法はありますか?

0 投票する
3 に答える
7519 参照

python - ローリングインパンダを使用したスライディングウィンドウイテレータ

単一行の場合、次のようにイテレータを取得できます

X[0:9, :]ここで、各反復子がサブセット、などを返すようにしたいのですがX[5:14, :]X[10:19, :]ローリング ( ) でこれを達成するにはどうすればよいpandas.DataFrame.rollingですか?