python - Pythonを使用して任意のサイトの「ダウンロードページ」をスクレイピングする方法

Question

Pythonを使用してバージョンに関する情報とそのダウンロードリンクを抽出するサイトのダウンロードページをスクレイプしたい。私は Python を学んでいて、beautifulsoup でそれをやりたいと思っていますが、これらのページは非常に複雑で、このようなものを見つけるのはかなり難しいようです。前もって感謝します

score 4 · Accepted Answer

スタックオーバーフローへようこそ! ――「スクラップ」は「捨てる」という意味なので、「スクラップ」という意味だと思います。

まず最初に、urllib2 を使用して、スクレイピングするページのファイルオブジェクトを作成する必要があります。方法については、これをお読みください。

次に、ページの html コンテンツを調べて、ページ自体から取得したい情報を把握する必要があります。

最後に、ファイルオブジェクトを Beautiful Soup のパーサーに渡し、HTML をナビゲートして、取得しようとしている情報を返します。

今後の参考のために、BeautifulSoup には美しいドキュメントがあります。プログラミングが上手になりたいと思ったら、ドキュメントの読み方を学ばなければなりません。ここからさらに難しくなるだけです。

python - Pythonを使用して任意のサイトの「ダウンロードページ」をスクレイピングする方法

1 に答える 1

Related

Reference