PythonでWebページをスクレイピングしようとしています。1 行にあるタグの結果は簡単に取得できましたが、複数行にまたがるタグの場合、私のコードでは何も取得できません。
HTML ソースでは、単一行タグは次のように表示されます。
<td><span class="facultyName">John Matthew Falletta, MD</span>
複数の行タグが次のように存在します。
<td><span class="label">Division:</span>
</td><td>Hematology/Oncology</td>
ここに私が書いたものがあります:
patFinderFullname = re.compile('<span class="facultyName">(.*)</span>')
fullname = re.findall(patFinderFullname,webpage) #works fine
patFinderDivision = re.compile('<span class="label">Division:</span> </td><td>(.*)</td>')
division = re.findall(patFinderDivision,webpage) #doesn't work
ここで、私の webpage 変数には、スクレイピングする必要がある URL が含まれています。誰かが私が欠けているもの、またはどこが間違っているかを指摘できますか?