次のページをクロールしました。
http://www.nasa.gov/topics/earth/features/plains-tornadoes-20120417.html
しかし、呼び出し時にセグメンテーション エラー (コア ダンプ) が発生しました: BeautifulSoup(page_html)。ここで、page_html はリクエスト ライブラリのコンテンツです。これは BeautifulSoup のバグですか? これを回避する方法はありますか?try...except のようなアプローチでも、コードを実行するのに役立ちます。前もって感謝します。
コードは次のとおりです。
import requests
from bs4 import BeautifulSoup
toy_url = 'http://www.nasa.gov/topics/earth/features/plains-tornadoes-20120417.html'
res = requests.get(toy_url,headers={"USER-Agent":"Firefox/12.0"})
page = res.content
soup = BeautifulSoup(page)