0

私はこのhtmlを持っています:

title="Keeper: Michal Buchalik" class="pos_text">Buchalik</a></span>                
                                            <span class="pos_text pos3_l_5">

合わせてみBuchalikます。

私はこのコードを思いつきました:

for gk in soup.find_all(re.compile("pos_text pos3_l_\d{1,2}")):
    print gk.previous_element.previous_element,

何にも一致せず、正規表現に問題があるに違いありません。代わりに特定の数値を入力すると、問題\d{1,2}なく機能します。

4

1 に答える 1

1

これは Python であるため、「生のテキスト」に r を使用するか、「\」文字をエスケープする必要があります。

re.compile(r"pos_text pos3_l_\d{1,2}")

OR

re.compile("pos_text pos3_l_\\d{1,2}")

それが役立つかどうかを確認してください。

乾杯。

于 2013-04-06T13:40:41.163 に答える