問題タブ [pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
925 参照

panel - 株式ポートフォリオの Pandas パネル

2 つの新しい短軸列 (ポートフォリオ保有とベンチマーク保有) を追加したい投資価格データのパンダ パネルがあります。

最初のパネルは次のとおりです。

概念的には次のようになります。

これらの列のみを持つ一致するパネルを作成してから、どうにかして 2 つをマージすることは可能ですか?

これを達成するための可能な代替方法について考えていますか?

Panel データ構造に関するドキュメントはかなりむき出しです。

編集:

2 番目のパネルを作成して p1.join(p2) を試しましたが、列の重複エラーが発生します。

追加したい2番目のパネルは次のとおりです。

0 投票する
2 に答える
2467 参照

python - Python: パンダのインストール エラー

EPD 7.1私はforのアカデミック ディストリビューションを持っています。MacOS 10.6.xこれには pandas0.3バージョンがあります。最新の公式バージョンな0.5.0ので、最新にアップグレードします。

これが私がしたことです:

  1. ここzipからソースのファイルを保存しました
  2. 実行されたsudo python setup.py install
  3. 実行してテストを実行しましたnosetests pandas

私はPythonの初心者であることを覚えておいてください。インストールが失敗した理由についての洞察をいただければ幸いです。以下はエラーの抜粋です。ログ全体は、エラー ログにあります。

結果:

55.011 秒で 1498 のテストを実行しました 失敗しました (スキップ = 4、エラー = 91、失敗 = 14)

@wesm - 素早い返信ありがとうございます。次回は必ずメーリングリストを利用します。だから私は実際にバックトラック...公式の0.5.0リリースをインストールし、ソースからコンパイルしました。3 つのエラーを受け取りました (以下を参照)。実行に問題はありませんでしたsudo python setup.py install

0 投票する
1 に答える
4617 参照

python - Pandas DataFrame への Python map() 関数の出力

Python の map() 関数を利用して、パラメータをトレーディング モデルに渡し、結果を出力します。itertools.product を使用して、2 つのパラメーターの可能な組み合わせをすべて見つけ、その組み合わせを「run」という名前の関数に渡します。関数 run は、リターンの pandas データフレームを返します。列ヘッダーは、2 つのパラメーターのタプルとリターンのシャープ率です。下記参照:

私の main() 関数は Pool() 機能を使用して、8 つのコアすべてで map() を実行します。

map 関数はリストしか出力できないことに気付きました。出力は、返されたデータフレームからのヘッダーのリストです。print test1 からの私の出力は次のようになります。

私の最終的な目標は、インデックス(すべてのリターンで同じ)、(ENTRYMULT、PXITR1PERIOD、SHARPE)の列ヘッダーと、対応する以下のリターンを持つパンダデータフレームを持つことです。次に、すべてのリターン シリーズでペアワイズ相関計算を行います。

0 投票する
3 に答える
4908 参照

python - pandas にスライスを適用する方法 文字列のシリーズ

私はパンダで遊んでいて、一連の文字列オブジェクトに文字列スライスを適用しようとしています。文字列をスライスする代わりに、シリーズをスライスします。

一方で:

代わりに map 関数を使用して動作させましたが、動作するはずの方法について何かが欠けていると思います。

説明をいただければ幸いです。

0 投票する
1 に答える
1044 参照

python - レコードからパンダを使用していくつかのcsvファイルにインデックスを付けますか?

"file1", "file2", ..."2つの列があるがヘッダーラベルがないcsvファイル()のリストがあります。それらにヘッダーラベルを割り当てDataFrame、ファイルによってインデックスが付けられ、次にそれらの列ラベルによってインデックスが付けられるようにします。たとえば、私は試しました:

これにより、によってインデックス付けされたDataFrame、testが生成されますが、それぞれによってインデックス付けされ、同様"myfile1", "myfile2"...にインデックス付けされるようにしたいと思います。私の質問は次のとおりです。"col1""col2"

  1. 最初のインデックスがファイルで、2番目のインデックスが(変数内でlabels)割り当てた列になるようにするにはどうすればよいですか?私が書くことができるように:

    test["myfile1"]["col1"]

今のところ、test["myfile1"]私に一連の記録を与えるだけです。

  1. また、最初のインデックスが各ファイルの列ラベルになり、2番目のインデックスがファイル名になるように、インデックスを再作成するにはどうすればよいですか?私が書くことができるように:

    test["col1"]["myfile1"]

または、などに表示されprint test["col1"]ているの値を確認します。"col1"myfile1, myfile2

0 投票する
3 に答える
35966 参照

python - Pythonパンダで複数の列を選択しますか?

csvファイルdfを使用して構築されたパンダのデータフレームがあります。pandas.read_tableデータフレームには複数の列があり、列の1つによってインデックスが作成されます(各行には、インデックス作成に使用されるその列の一意の値があるという点で一意です)。

複数の列に適用される「複雑な」フィルターに基づいてデータフレームの行を選択するにはどうすればよいですか?colAたとえば、列が10より大きいデータフレームのスライスを簡単に選択できます。

しかし、次のようなフィルターが必要な場合はどうなりますか:列のいずれかdfが10より大きいスライスを選択しますか?

または、の値colAが10より大きいが、の値がcolB5未満の場合はどうでしょうか。

これらはパンダでどのように実装されていますか?ありがとう。

0 投票する
1 に答える
1292 参照

python - Pandas を使用した一意でない列によってインデックス付けされた DataFrame から Panel

次のコードは私が望むことを行うはずですが、ループで20%完了するまでに10GBのRAMが必要です。

0 投票する
4 に答える
20301 参照

python - 2012 年の R での data.table のマージよりも、python での pandas のマージの方が速いのはなぜですか?

私は最近、python 用のpandasライブラリに出会いました。これは、このベンチマークによると、非常に高速なインメモリ マージを実行します。R (分析用に選択した言語)のdata.tableパッケージよりもさらに高速です。

pandasよりもはるかに速いのはなぜdata.tableですか? それは、Python が R よりも優れている固有の速度の利点によるものですか、それとも私が気付いていないトレードオフがありますか? anddata.tableに頼らずに内部結合と外部結合を実行する方法はありますか?merge(X, Y, all=FALSE)merge(X, Y, all=TRUE)

比較

さまざまなパッケージのベンチマークに使用されたR コードPython コードを次に示します。

0 投票する
1 に答える
2148 参照

python - Pandas DataFrame シリアライゼーション

pandas データフレームのエントリを文字列バッファに書き込むのに問題があります。

stringbuffer を read_csv 関数に渡すことで、データフレームを初期化することができます。

DataFrame.to_csvこの関数は文字列のファイル パスしか受け付けないため、反対のことを行うのは簡単ではありません。

この動作に正当な理由はありますか? 最初にコンテンツをディスクに保存せずに pandas DataFrame をシリアル化する最良の方法は何ですか?

0 投票する
2 に答える
11893 参照

matplotlib - IPython で Pandas を使用して株価チャートをプロットする

Python/Pandas を使い始めたばかりで、次のコードをまとめて S&P 500 をプロットします。

これは、高値、安値、始値、終値、調整された終値、および出来高をすべて 1 つのグラフにプロットしているように見えます。Yahooや他のほとんどの金融サイトのように、1 つのグラフに adj 終値とそのすぐ下の出来高だけをプロットする簡単な方法はありますか? OHLC ローソク足チャートをプロットする例にも興味があります。