python - dirrectmirror Web ページで beautifulsoup4 のリンクを抽出できません

Question

http://www.directmirror.com/files/0GR7ZPCYのような特定の Web ページからリンクを抽出しようとしています。

しかし、bs4 のドキュメントの例のようには機能しません。誰かが私の理由を指摘できますか? 私のコードは次のとおりです。

import urllib2
from bs4 import BeautifulSoup
response = urllib2.urlopen('http://www.directmirror.com/files/0GR7ZPCY')
html = response.read()
sp = BeautifulSoup(html)
ll = sp.find_all('a')

私が得た「ll」変数は空です。

score 0 · Accepted Answer

編集:問題は BS4 の Ubuntu のインストールにあるように見えた - ピップでアンインストールして再インストールすると問題が解決した

これは、両方のケースを使用して実際に機能します（find_allBS4とそれ以前の場合findAll）。sp変数にコンテンツがあることを確認しましたか?

In [1]: import urllib2

In [2]: from bs4 import BeautifulSoup

In [3]: response = urllib2.urlopen('http://www.directmirror.com/files/0GR7ZPCY')

In [4]: html = response.read()

In [5]: sp = BeautifulSoup(html)

In [6]: ll = sp.find_all('a')

In [7]: ll
Out[7]:
[<a class="twitter-share-button" data-count="vertical" data-via="DirectMirror" href="http://twitter.com/share">Tweet</a>,
 <a href="/"><img alt="logo" border="0" src="/images/logo2.png"/></a>,
 <a href="/register.php" style="color:#ffffff">Register</a>,
 <a href="/login.php" style="color:#ffffff">Login</a>,
 # Continues...

python - dirrectmirror Web ページで beautifulsoup4 のリンクを抽出できません

1 に答える 1

Related

Reference