ウィキペディアの人の誕生日を取得するためにbeautifulsoupを使用しようとしています。たとえば、http://en.wikipedia.org/wiki/Ezra_Taft_Bensonの誕生日は1899年8月4日です。bdayにアクセスするには、次のコードを使用しています。
bday = url.find("span", class_="bday")
bday
ただし、別のタグの一部としてhtmlコードに表示されるインスタンスを取得しています。すなわち<span class="bday dtstart published updated">1985-11-10 </span>
。
正確なクラスタグをbday
のみと一致させる方法はありますか?
bday
現在、正しい日付ではない1985-11-10になるようになっているので、質問が明確であることを願っています。