私は Web クローラーに取り組んでおり、マルチプロセッシングを使用して、一度に 4 つのページをダウンロードして処理しています。ただし、同じページを複数回クロールするつもりはありません。
マルチプロセッシングを実装する前に、クロールされた URL のコレクションを維持するためにセットを使用しました。メンバーシップ テストに理想的であるため、セットを選択しました。multiprocessing.Manager は、4 つのプロセス間で共有 Set を実装するのに役立つと思いました。しかし、そうではありません。
私がやりたいことは次のようなものです
manager = Manager()
d = manager.set()
しかし、Manager クラスにはそのような関数はありません。
私の問題を解決する方法や解決策を知っている人はいますか?