問題タブ [pandasql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - パンダのスピードアップは max() に適用されます
Cython などを使用して、次の関数を高速化する方法を知りたいですか?
この関数は、1 つの列でグループ化し、各グループのターゲットが最大値を達成するすべての行を返します。結果のデータフレームが返されます。
df にたとえば 500K 行がある場合、上記の関数は私のコンピューターで完了するのに約 5 分かかります。このパフォーマンスは問題ありませんが、1,000 万行を超えるデータがあります... もちろん、1 つの解決策は、SQL サーバー内でクエリとして上記を実行し、Python に結果を取得させることですが、SQL-無料の Pythonic ソリューション。
python - python pandasでdatetimeフィールドをMON-YYYYとしてフォーマットし、nullを無視する
以下のようにpython pandasデータフレーム「df」があります-
のvendor_created_date
形式は ですdatetime64[ns]
。
ここで、フィールド値がフォーマットされるべきfomatted_date
場所と呼ばれる新しいフィールドを作成したいと思います &日付フィールドの行を削除したいと思います.vendor_created_date
MON-YYYY
NaT
道順を教えてください。
pandas - PandaSQL でのユーザー入力変数の使用
私が持っているデータフレームで pandaSQL を使用しようとしていますが、変数を使用する方法があるかどうか、またはそれを行う別の方法があるかどうか疑問に思っています。私がやろうとしているのは、ユーザー入力を変数として設定し、それを SQL ステートメントで使用しようとすることです。入力時に形状であるすべてのインスタンスを表示したい。私は次の行に沿って試しています:
しかし、これまでのところ運がありません。変数を導入するときに問題が発生しています。これは pandaSQL で可能ですか?そうでない場合は、どのような回避策を使用できますか?
python - pandasql はインポートされません: ImportError: 名前 to_sql をインポートできません
Linux コマンド プロンプトで pip を使用して pandasql をインストールし、ipython ノートブックを起動しました。
次に、パンダとそれを ipython ノートブックにインポートしようとしました。
..そして、それは幸せではありません。周りを見回しましたが、どこにも答えがないようです。それが与えたエラーメッセージは次のとおりです。
誰にもアイデアはありますか?乾杯
python - リストから値を出力します (DataFrame の真の値はあいまいなエラーです)
質問があります。レコードのリストがあり、最初のリストと比較している別のレコードのリストがあります。私が行を書くとき(最初のリストの行の読み取りの内側:
結果が出ます
11763 は output_merged_stock ID 番号で、Whs は PN_stripped が一致する倉庫の名前です。
しかし、さらに処理するためにデータを抽出できません。if を尋ねることができるシンプルな if ステートメントを書きたいだけですwhs = VLN
。私が書いた:
エラーが発生しました:The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
私が書いた:
そして、私は再び得ました:The truth value of a DataFrame is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
結果「VLN」を取得したい場合、ifステートメントはどのように記述すればよいですか? たとえば、ストック出力が 3 Wh の場合があり、そのうちの 2 つが「VLN」で 3 つ目が「XRS」であり、その場合、「if」出力が XRS なしの VLN の 2 倍であることがわかります。
python - Python Pandas to_sql は、テーブルへの書き込み時にすべてのテーブル インデックスを削除します
多くのテーブルを結合する左から形成された MYSQL 選択コマンドを読み取る次のコードがあります。次に、結果を別のテーブルに書き込みたいと思います。ただし、(パンダを使用して)それを行うと、正しく機能し、データがテーブルに追加されますが、主キーを含むテーブルからすべてのインデックスが何らかの形で破棄されます。
コードは次のとおりです。
何か案は?
編集:
if_exists='replace' を使用すると、Pandas はテーブルを削除して再作成し、再作成してもインデックスを再構築しないようです。
さらに、この質問: to_sql pandas method changes the scheme of sqlite tables は、sqlalchemy エンジンを使用することで問題を解決できる可能性があることを示唆しています。
編集:
if_exists="append" を使用しても問題は発生しません。問題が発生するのは if_exists="replace" のみです。