-3

Pythonを使用してバージョンに関する情報とそのダウンロードリンクを抽出するサイトのダウンロードページをスクレイプしたい。私は Python を学んでいて、beautifulsoup でそれをやりたいと思っていますが、これらのページは非常に複雑で、このようなものを見つけるのはかなり難しいようです。前もって感謝します

4

1 に答える 1

4

スタック オーバーフローへようこそ! ――「スクラップ」は「捨てる」という意味なので、「スクラップ」という意味だと思います。

まず最初に、urllib2 を使用して、スクレイピングするページのファイル オブジェクトを作成する必要があります。方法については、これをお読みください。

次に、ページの html コンテンツを調べて、ページ自体から取得したい情報を把握する必要があります。

最後に、ファイル オブジェクトを Beautiful Soup のパーサーに渡し、HTML をナビゲートして、取得しようとしている情報を返します。

今後の参考のために、BeautifulSoup には美しいドキュメントがあります。プログラミングが上手になりたいと思ったら、ドキュメントの読み方を学ばなければなりません。ここからさらに難しくなるだけです。

于 2012-11-08T17:48:19.060 に答える