Pythonを使用してバージョンに関する情報とそのダウンロードリンクを抽出するサイトのダウンロードページをスクレイプしたい。私は Python を学んでいて、beautifulsoup でそれをやりたいと思っていますが、これらのページは非常に複雑で、このようなものを見つけるのはかなり難しいようです。前もって感謝します
1 に答える
4
スタック オーバーフローへようこそ! ――「スクラップ」は「捨てる」という意味なので、「スクラップ」という意味だと思います。
まず最初に、urllib2 を使用して、スクレイピングするページのファイル オブジェクトを作成する必要があります。方法については、これをお読みください。
次に、ページの html コンテンツを調べて、ページ自体から取得したい情報を把握する必要があります。
最後に、ファイル オブジェクトを Beautiful Soup のパーサーに渡し、HTML をナビゲートして、取得しようとしている情報を返します。
今後の参考のために、BeautifulSoup には美しいドキュメントがあります。プログラミングが上手になりたいと思ったら、ドキュメントの読み方を学ばなければなりません。ここからさらに難しくなるだけです。
于 2012-11-08T17:48:19.060 に答える