問題タブ [pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 各列に異なる関数を適用してデータフレームをリサンプリングするにはどうすればよいですか?
私はパンダの温度と放射の時系列を持っていますdataframe
。時間分解能は通常のステップで1分です。
dataframe
これを1時間の解像度にダウンサンプリングして、温度の1時間あたりの平均と、放射の1時間あたりの合計を計算するにはどうすればよいですか?
python - WindowsにPython2.5を使用してPandasをインストールする
WindowsXPを実行しているマシンにPython2.5を搭載したPandasをインストールしようとしています。
インストールは問題なく終了したようですが、試してみると
次のエラーが発生します。
私の知る限り、すべての依存関係が正しくインストールされています。問題はfunctools.py
、Python標準ライブラリ(?)の一部であるに関係しています。
誰か提案がありますか?PandasはPython2.5で動作するはずなので、Python構成に問題があると思います。
python - python-pandas と mysql のようなデータベース
Pandas のドキュメントには、さまざまな形式で保存されたデータを操作するためのベスト プラクティスの例が数多くあります。
ただし、たとえば MySQL などのデータベースを操作するための良い例を見つけることができません。
mysql-pythonを使用してクエリ結果を Pandas のデータ フレームに効率的に変換する方法のリンクを示したり、コード スニペットを提供したりできますか?
pandas - パンダ:単純な「結合」が機能しない?
私は自分は馬鹿ではないと思いたいのですが、間違っているかもしれません。これが機能しない理由を誰かに説明できますか? 「マージ」を使用して、目的の結果を得ることができます。しかし、最終的には複数に参加するpandas
DataFrames
必要があるため、この方法を機能させる必要があります。
python - 新しい値を挿入する最良の方法
パンダのデータフレームを使用して、取引日にライブでダウンロードする市場データを追跡したいと考えています。
AAPL と GOOG の価格を記録したいとしましょう。まず、データフレームを作成します。
最初のデータポイントが時間 t1 に到着し、AAPL の価格が 555.0 であるとします。そして数秒後の t2 で、GOOG の価格が 430.0 になります。
もちろんできません:
パンダでこれを達成するための簡単で速い方法はありますか?
python - 一意でないデータを含むパンダの配列からの多重指数
私は次のデータフレームを持っています
私の質問は、データが一意でないことを考慮して、インデックス(またはMultiIndexes)として(Z、A)を持つMultiIndexを持つようにデータをグループ化/変換するにはどうすればよいですか?私の目標をクリアするために、これは私が達成することを期待していることです:
これには少なくとも2つのステップが含まれることを理解しています。1つは一意性のため、もう1つはZ、Aでのインデックス作成のためです。したがって、これらのステップの1つで助けがあれば幸いです。また、この問題により適したデータ構造はありますか?
編集:私は次の行を見つけました:
data = data.set_index(('Z'、'A'))
Z、Aのインデックス作成の問題を解決します。残念ながら、これは(Z、A)ペアが一意である場合にのみ機能します。
python - パンダ:ヒストグラムの結果によるインデックスデータ
確率でデータにインデックスを付けようとしています(単純なヒストグラムで推定)。目的は、あるしきい値よりも低い確率でシリーズ内のアイテムを選択することです。
たとえば、一連の整数値があります。
次に、次のようにヒストグラムを計算します。
これで、各結果の頻度が結果と一連の結果によってインデックス化されました。私は今2つの質問があります:
series
によって定義された結果/頻度のマッピングによってインデックスを作成する方法はありfreq
ますか?- これを行うことができた場合、ある値よりも高い頻度の結果のみを選択するにはどうすればよいですか?
ありがとう。
python - パンダ:マージがどのように機能するかを理解するのに苦労
マージで何か問題があり、それが何であるか理解できません。一連の整数値のヒストグラムを推定するために、次のことを行いました。
私が印刷hist
し、freq
これが私が得るものである場合:
それらは両方ともによって索引付けされています"series"
が、マージしようとすると:
KeyError: 'no item named series'
例外が発生します。省略するon = "series"
と、IndexError: list index out of range
例外が発生します。
間違っていることがわかりません。「シリーズ」は列ではなくインデックスである可能性があるので、別の方法で行う必要がありますか?
python - パンダで高値安値始値チャートを作成する方法
ファイルからPythonにストリーミングできるデータセットがあります。pandas を使用して、asof メソッドを使用して 9:46 の時間ゼロから始まる 1 分ごとのデータの HLOC チャートを作成したいと思います。更新として pandas データフレームにデータをストリーミングする方法も知りたいです。これは可能ですか?
python - 混乱パンダのインポート
今日までに0.71個のパンダを持っていました。更新しようとしましたが、Webサイトから提供された.exeファイルを実行しただけです。
「パンダのインポート」を試しましたが、エラーが発生します
ImportError:C拡張機能がビルドされていません:インストール済みの場合は、ソースディレクトリからインポートしていないことを確認してください。
私は一般的にPythonとパンダに不慣れです。何でも役に立ちます。
ありがとう、