私は定期的に 1,500 万行を超えるデータ フレームに対して pandas 操作を実行しており、特定の操作の進行状況インジケーターにアクセスしたいと考えています。
pandas split-apply-combine 操作のテキストベースの進行状況インジケーターは存在しますか?
たとえば、次のようなものです。
df_users.groupby(['userID', 'requestDate']).apply(feature_rollup)
wherefeature_rollup
は、多くの DF 列を取り、さまざまな方法で新しいユーザー列を作成するやや複雑な関数です。大きなデータ フレームの場合、これらの操作には時間がかかることがあるため、進行状況を更新する iPython ノートブックでテキスト ベースの出力が可能かどうかを知りたいです。
これまでのところ、Python の正規ループ進行状況インジケーターを試してみましたが、意味のある方法で pandas とやり取りすることはありません。
分割-適用-結合の進行状況を知ることができる pandas ライブラリ/ドキュメントで見落としているものがあることを願っています。apply
単純な実装では、関数が動作しているデータ フレーム サブセットの総数を確認し、進行状況をそれらのサブセットの完了した部分として報告します。
これはおそらくライブラリに追加する必要があるものですか?