0

特定のサイトから画像をダウンロードするある種の画像アーカイバーを Python で作成しようとしていますが、beautifulsoup 行に表示される ioerror errno22 無効なモード ('r') またはファイル名エラーが発生し続けます。

soup = BeautifulSoup(open(pahealUrl))

aTagList = soup.findall("a")

for randomTag in aTagList:
  if randomTag.find(text="Image Only"):
    imageList.append(randomTag) 

print randomTag

URL 自体は有効で、何が問題なのかわかりません。errno22 無効なモード /filename エラーをスローする理由について何か考えはありますか?

4

1 に答える 1

1

Web ページの html を取得するには、urllib2ライブラリを使用します。

import urllib2
html = urllib2.urlopen(myurl).read()

open()は Web ページを開くのではなく、ファイルに使用します。そのため、ファイル名エラーが発生しています。

次にBeautifulSoup()、HTML でスープを取得できます。

于 2013-04-02T07:01:48.353 に答える