私は、Web ページの HTML の解析を扱うプロジェクトに参加しています。そこで、ブログ(Bloggers Blog - Dynamic Template) の内容を読んでみました。残念ながら、ブログの Web ページの「実際の」ソースを確認できませんでした。
ここに私が観察したものがあります:
view source
ブログのランダムな記事をクリックして、その中のコンテンツを見つけようとしました。そして、私は何も見つけることができませんでした。それはすべてJavaScriptでした。そこで、そのウェブページをラップトップに保存してソースを再度確認したところ、今度はコンテンツが見つかりました。
また、ブラウザを使用してソースを確認し
developers tools
たところ、その中にコンテンツが見つかりました。今、私はpythonの方法を試しました
import urllib from bs4 import BeautifulSoup soup = BeautifulSoup( urllib.urlopen("my-webpage-address") ) print soup.prettify()
HTMLコードのコンテンツも見つかりませんでした。
最後に、ケース 1、4 でソース コード内のコンテンツが見つからない理由を説明します。
実際の HTML コードを取得するにはどうすればよいですか? 仕事をするpythonライブラリを聞きたいです。