問題タブ [pandas]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Pandas: pandas のインポート時に numpy.core.multiarray が見つかりません
パンダをインポートするコード (Eclipse で実行) を取得しようとしています。
"ImportError: numpy.core.multiarray failed to import"
パンダをインポートしようとすると、次のエラーが発生します。python2.7
、pandas 0.7.1
、およびを使用していますnumpy 1.5.1
python - 混合モードのパンダデータフレームは hdf5 にシリアル化できませんか?
パンダでは、混合型のデータフレームを保存できないようです:
これにより、Exception: Cannot currently store mixed-type DataFrame objects in Table format
これは Pandas 固有の制限によるものですか、それとも単に将来の楽しみのためですか? HDFStore
多くのデータフレームが混合タイプになるため、この制限ではあまり役に立たないようです。
python - tsv ファイルを Pandas DataFrame にロードする方法は?
私はpythonとpandasが初めてです。tsv
ファイルを pandas にロードしようとしていますDataFrame
。
これは私がしようとしているものであり、私が得ているエラーです:
python - pandas.read_csvを使用してcsvファイルからデータをロードするときにdtypeを指定するにはどうすればよいですか?
次の形式のテキストファイルがいくつかあります。
read_csvを使用してそれらをDataFrameにロードすると、一部の列に対して正しいdtypeが生成されません。たとえば、最初の列はユニコードstrではなくintとして解析され、3番目の列は1つのデータが欠落しているため、intではなくユニコードstrとして解析されます...データフレームのdtypeをプリセットする方法はありますか? numpy.genfromtxtはしますか?
更新:私はread_csv
このように使用したため、問題が発生しました:
dtypeとエンコーディングの両方の問題を解決するにはunicode()
、numpy.genfromtxt
最初に次を使用する必要があります。
と設定read_csv
を追加できればいいですね。欲張りでごめんなさい。^ _ ^dtype
usecols
python - パンダで固定幅形式のテキストファイルを読み取るにはどうすればよいですか?
パンダを手に入れたばかりで、ファイルを読み取る方法を考えています。このファイルは WRDS データベースからのもので、1960 年代までさかのぼる SP500 構成銘柄リストです。ファイルを確認しましたが、 を使用してインポートするために何をしてread_csv
も、データを正しく表示できません。
上記の出力のチャンクはどういう意味ですか? 何でも役に立ちます。
python - 特定の列をdatetimeオブジェクトとして解析するが、インデックスにはしないようにパンダに指示するにはどうすればよいですか?
列の 1 つが日付/時刻文字列である csv ファイルがあります。で正しく解析するにはどうすればよいpandas
ですか? その列をインデックスにしたくありません。ありがとう!
ウリ
python - パンダはデータフレームをタプルの配列に変換します
パンダを使用して一部のデータを操作しましたが、データベースにバッチ保存を実行したいと考えています。これには、データフレームをタプルの配列に変換する必要があり、各タプルはデータフレームの「行」に対応します。
私のデータフレームは次のようになります。
次のようなタプルの配列に変換したい:
これを効率的に行う方法について何か提案はありますか?
python - 重複時系列データの Pandas ローリング中央値
Pandas では時系列インデックスの重複はまだ許可されていません ( https://github.com/pydata/pandas/issues/643 ) が、まもなく追加される予定です。マルチインデックスタグ/列によって重複した時間を持つデータセットにローリングウィンドウ平均を適用する良い方法があるかどうか疑問に思っています
基本的に、エポックタイム、階層タグ (tag1、tag2)、および所要時間で構成される順序付けられていないイベントの csv があります。小さなサンプル:
私がやりたいことは、イベントおよびイベント+タグによって、さまざまなミリ秒ウィンドウでローリング手段を構築およびグラフ化することです。これは Pandas で実現する必要があるようですが、最初に時系列インデックスが複製されるまで待つ必要があるかどうかはわかりません。これを今すぐハッキングすることについて何か考えはありますか?
python - パンダを使用してインデックス付きの列をDataFrameに追加します
私はパンダの初心者ユーザーですが、ドキュメントを調べた後でも、次のことを行う簡単な方法を見つけることができません。
pandas.DateRangeインデックスを持つDataFrameがあり、同じDateRangeの一部の値を持つ列を追加したいと思います。
私が持っているとしましょう
と
どうすれば次のようなものを入手できますか?
python - パンダで上書きして結合またはマージする
日時インデックスを持つデータフレームで結合/マージ/追加操作を実行したいと考えています。
df1
私が持っていて、それに追加したいとしましょうdf2
。 df2
より少ないまたはより多くの列、および重複するインデックスを持つことができます。インデックスが一致するすべての行についてdf2
、 と同じ列がある場合df1
、 の値を の値でdf1
上書きしますdf2
。
どうすれば望ましい結果を得ることができますか?