問題タブ [pandas]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
5829 参照

python - Python Pandas: pandas のインポート時に numpy.core.multiarray が見つかりません

パンダをインポートするコード (Eclipse で実行) を取得しようとしています。

"ImportError: numpy.core.multiarray failed to import"パンダをインポートしようとすると、次のエラーが発生します。python2.7pandas 0.7.1、およびを使用していますnumpy 1.5.1

0 投票する
1 に答える
1262 参照

python - 混合モードのパンダデータフレームは hdf5 にシリアル化できませんか?

パンダでは、混合型のデータフレームを保存できないようです:

これにより、Exception: Cannot currently store mixed-type DataFrame objects in Table format

これは Pandas 固有の制限によるものですか、それとも単に将来の楽しみのためですか? HDFStore多くのデータフレームが混合タイプになるため、この制限ではあまり役に立たないようです。

0 投票する
8 に答える
262125 参照

python - tsv ファイルを Pandas DataFrame にロードする方法は?

私はpythonとpandasが初めてです。tsvファイルを pandas にロードしようとしていますDataFrame

これは私がしようとしているものであり、私が得ているエラーです:

0 投票する
2 に答える
5024 参照

python - pandas.read_csvを使用してcsvファイルからデータをロードするときにdtypeを指定するにはどうすればよいですか?

次の形式のテキストファイルがいくつかあります。


read_csvを使用してそれらをDataFrameにロードすると、一部の列に対して正しいdtypeが生成されません。たとえば、最初の列はユニコードstrではなくintとして解析され、3番目の列は1つのデータが欠落しているため、intではなくユニコードstrとして解析されます...データフレームのdtypeをプリセットする方法はありますか? numpy.genfromtxtはしますか?

更新:私はread_csvこのように使用したため、問題が発生しました:

dtypeとエンコーディングの両方の問題を解決するにはunicode()numpy.genfromtxt最初に次を使用する必要があります。

と設定read_csvを追加できればいいですね。欲張りでごめんなさい。^ _ ^dtypeusecols

0 投票する
4 に答える
20066 参照

python - パンダで固定幅形式のテキストファイルを読み取るにはどうすればよいですか?

パンダを手に入れたばかりで、ファイルを読み取る方法を考えています。このファイルは WRDS データベースからのもので、1960 年代までさかのぼる SP500 構成銘柄リストです。ファイルを確認しましたが、 を使用してインポートするために何をしてread_csvも、データを正しく表示できません。

上記の出力のチャンクはどういう意味ですか? 何でも役に立ちます。

0 投票する
1 に答える
1376 参照

python - 特定の列をdatetimeオブジェクトとして解析するが、インデックスにはしないようにパンダに指示するにはどうすればよいですか?

列の 1 つが日付/時刻文字列である csv ファイルがあります。で正しく解析するにはどうすればよいpandasですか? その列をインデックスにしたくありません。ありがとう!

ウリ

0 投票する
10 に答える
224712 参照

python - パンダはデータフレームをタプルの配列に変換します

パンダを使用して一部のデータを操作しましたが、データベースにバッチ保存を実行したいと考えています。これには、データフレームをタプルの配列に変換する必要があり、各タプルはデータフレームの「行」に対応します。

私のデータフレームは次のようになります。

次のようなタプルの配列に変換したい:

これを効率的に行う方法について何か提案はありますか?

0 投票する
1 に答える
3296 参照

python - 重複時系列データの Pandas ローリング中央値

Pandas では時系列インデックスの重複はまだ許可されていません ( https://github.com/pydata/pandas/issues/643 ) が、まもなく追加される予定です。マルチインデックスタグ/列によって重複した時間を持つデータセットにローリングウィンドウ平均を適用する良い方法があるかどうか疑問に思っています

基本的に、エポックタイム、階層タグ (tag1、tag2)、および所要時間で構成される順序付けられていないイベントの csv があります。小さなサンプル:

私がやりたいことは、イベントおよびイベント+タグによって、さまざまなミリ秒ウィンドウでローリング手段を構築およびグラフ化することです。これは Pandas で実現する必要があるようですが、最初に時系列インデックスが複製されるまで待つ必要があるかどうかはわかりません。これを今すぐハッキングすることについて何か考えはありますか?

0 投票する
2 に答える
11115 参照

python - パンダを使用してインデックス付きの列をDataFrameに追加します

私はパンダの初心者ユーザーですが、ドキュメントを調べた後でも、次のことを行う簡単な方法を見つけることができません。

pandas.DateRangeインデックスを持つDataFrameがあり、同じDateRangeの一部の値を持つ列を追加したいと思います。

私が持っているとしましょう

どうすれば次のようなものを入手できますか?

0 投票する
2 に答える
43488 参照

python - パンダで上書きして結合またはマージする

日時インデックスを持つデータフレームで結合/マージ/追加操作を実行したいと考えています。

df1私が持っていて、それに追加したいとしましょうdf2df2より少ないまたはより多くの列、および重複するインデックスを持つことができます。インデックスが一致するすべての行についてdf2、 と同じ列がある場合df1、 の値を の値でdf1上書きしますdf2

どうすれば望ましい結果を得ることができますか?