問題タブ [bs4]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
9035 参照

python - Beautifulsoup の URL の警告を抑制

Beautiful Soup 4 を使用して、インターネットからスクレイピングした html 形式のテキストを解析しています。場合によっては、このテキストが Web サイトへのリンクにすぎないこともあります。BS4が非常に矛盾しているという事実:

私はこの事実を十分に認識しており、講義を受けるのではなく、テキスト入力を解釈したいだけです。スクリプトのアクティビティを監視するためにコンソールを使用していますが、非常に怒っているライブラリによって混乱しています。

この警告を抑制または無効にする方法はありますか?

0 投票する
2 に答える
14611 参照

python - .txtファイルへのBeautifulSoup出力

データを .txt ファイルとしてエクスポートしようとしています

何を入れる必要があります:

働く?

また、文字列でそれを行う必要があるURLと同じ.txtファイルの名前を取得しようとしていますか?


0 投票する
2 に答える
130 参照

python - Web Scrape が必要なすべてのデータをスクレイピングできない

このウィキペディアのページからデータをスクレイピングしようとしているプロジェクトに取り組んでいます。年の列 (たまたま<th>) と 4 番目の列「ウォルト ディズニー パークス アンド リゾート」が必要です。

コード:

現在、ターミナルで実行すると、1991 (2 回) と 2,794 だけが出力されます。ウォルト ディズニー パークス アンド リゾーツからのすべての年と関連する収益を印刷するために必要です。また、ファイル「scrape_project.tx」に書き込むようにしようとしています

どんな助けでも大歓迎です!