問題タブ [multiprocessing-manager]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 複数のプロセス間でのレート制限ダウンロード
ウェブサイトから大量のファイルをダウンロードして処理したい。サイトの利用規約により、1 秒あたりにダウンロードできるファイル数が制限されています。
ファイルの処理にかかる時間が実はボトルネックなので、複数のファイルを並行して処理できるようにしたい。しかし、さまざまなプロセスが組み合わさってダウンロード制限に違反することは望ましくありません。したがって、オーバーリクエスト率を制限するものが必要です。私は次のようなことを考えていましたが、私はmultiprocessing
モジュールの専門家ではありません。
次に、別の場所でダウンロードを実行します
これは小規模ではうまくいっているように見えますが、ロックが本当に正しく行われているのか少し心配です。
また、同じ目標を達成するためのより良いパターンがあれば、ぜひ聞きたいです。
python - pandas + multiprocessing: "NotImplementedError: DataFrames ではサポートされていません!"
前のスレッドが重複としてマークされた後、マルチプロセッシング マネージャーの方向に向けられました。マルチプロセッシングを使用して、パンダのデータフレームを処理して Flask リクエストに渡すサービスを作成しようとしています。これまでの私のコードは次のとおりです。
df_manager.py
data_handler.py
残念ながら、これは を呼び出そうとすると例外をスローしmanager.get_df()
ますdata_handler.py
。
正しい方向への助けをいただければ幸いです。
EDIT : これは特に DataFrames によって引き起こされたようdf.to_json()
です。まだまだ調査中…df
df_manager.py
EDIT2:Flaskの依存関係を削除するようにコードを更新しました.Flaskとは関係がないようです。
python - Python でネストされたサブプロセスから「非ピクル可能」オブジェクトをメインスレッドに戻す方法
いくつかのプロセスを開始する python プログラムがあります。そして、これらのプロセスは、独自のサブプロセス (ネストされたプロセス) を生成します。メインまたはサブプロセスのいずれかによって開始されたすべてのプロセスのリストを保持したいのですが、ネストされたプロセスのハンドルをメインに戻す方法がわかりませんでした。これは私が試したものですが、コンパイラはプロセスハンドルは選択できないと言います。