問題タブ [python-newspaper]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Newspapers3k Newspapers ライブラリのマルチスレッド処理が無期限にハングする
私はゲーム メディア サイトから記事を抽出するプロジェクトに取り組んでおり、基本的なテスト ランを行っています。VSCode のデバッガーによると、マルチスレッド抽出を設定した時点で一貫してハングします (スレッドの数は役に立ちません) 2 つのサイトで。正直なところ、ここで何が間違っているのかわかりません。レイアウトされている例に従いました。サイトの 1 つである Gamespot は、誰かのチュートリアルでも使用されており、もう 1 つのサイト (Polygon) を削除しようとしましたが、役に立たないようです。仮想環境を作成し、Python 3.8 と 3.7 の両方でこれを試しました。すべての依存関係が満たされているように見えます。私も repl dot it でテストしましたが、同じハングがありました。
私は何か間違ったことをしているだけなので、それを修正できると聞きたいです。これらの特定の Web サイトとその記事について、データ サイエンスを実行したいと思っています。しかし、少なくとも OS X ユーザーにとっては、マルチスレッドに何らかのバグがあるようです。これが私のコードです:
そして、最終的にあきらめてコンソールで割り込みをヒットしたときに返されるものは次のとおりです。