私は最近、ユーザーが任意の動詞を簡単に活用できるようにするPythonのプログラムに取り組み始めました。これを行うには、urllibモジュールを使用して、対応する活用のWebページを開きます。たとえば、動詞「beber」には次のWebページがあります。
ページを開くには、次のPythonコードを使用します。
source = urllib.urlopen("http://wwww.spanishdict.com/conjugate/beber").read()
このソースには、解析したい情報が含まれています。しかし、BeautifulSoupオブジェクトを次のように作成すると、次のようになります。
soup = BeautifulSoup(source)
解析したいすべての情報が失われているようです。BeautifulSoupオブジェクトを作成するときに失われる情報は、通常、次のようになります。
<tr>
<td class="verb-pronoun-row">
yo </td>
<td class="">
bebo </td>
<td class="">
bebí </td>
<td class="">
bebía </td>
<td class="">
bebería </td>
<td class="">
beberé </td>
</tr>
私は何が間違っているのですか?私は一般的にPythonやWeb解析の専門家ではないので、単純な問題かもしれません。
これが私の完全なコードです(2つを区別するために「++++++」を使用しました):
import urllib
from bs4 import BeautifulSoup
source = urllib.urlopen("http://www.spanishdict.com/conjugate/beber").read()
soup = BeautifulSoup(source)
print source
print "+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++"
print str(soup)