6

私はSeleniumWebDriverとPythonバインディングを使用して、単調なWordPressタスクを自動化していますが、これまでは非常に簡単でした。チェックボックスを選択しようとしていますが、それを識別する唯一の方法は、それに続くテキストです。HTMLの関連部分は次のとおりです。

<li id="product_cat-52">
    <label class="selectit">
       <input value="52" type="checkbox" name="tax_input[product_cat][]" id="in-product_cat-52"> polishpottery
    </label>
</li>

このチェックボックスを識別するためにスクリプトにある唯一の情報は、文字列「polishpottery」です。次のテキストだけを知っているチェックボックスを選択する方法はありますか?

4

3 に答える 3

8

@ sherwin-wuがすでに述べたように、ID、名前、またはクラス(およびおそらくそれらの組み合わせ)に基づいて、必要なものを選択する方法を見つける必要があります。あなたの例では、そうするのに十分な可能性があるようですが、ページの残りの部分が通常どのように見えるかはわかりません。

そうは言っても、次のようなXPathセレクターを使用して要求したことを実行することは可能です。

driver.find_element_by_xpath("//li/label/input[contains(..,'polishpottery')]")
于 2012-07-10T08:31:49.590 に答える
0

正規表現-おそらく最善の解決策ではありませんが、機能するはずです。

import re

def get_id(str, html_page): # str in this case would be 'polishpottery'
    return re.search(r'<input[^<>]*?type="checkbox"[^<>]*?id="([A-Za-z0-9_ -]*?)"[^<>]*?> ?' + str, html_page).group(1)

id = get_id('polishpottery', html)
checkbox = driver.find_element_by_id(id)
checkbox.toggle()

# Or, more minimallistically:
driver.find_element_by_id(get_id('polishpottery', html)).toggle()

出力:

>>> print(html)
<li id="product_cat-52">
    <label class="selectit">
       <input value="52" type="checkbox" name="tax_input[product_cat][]" id="in-product_cat-52"> polishpottery
    </label>
</li>
>>> get_id('polishpottery', html)
'in-product_cat-52'
于 2012-07-10T03:51:47.583 に答える
0

チェックボックスを選択する他の方法を探すことをお勧めします。たとえば、browser.find_element_by_id(id)を使用して、IDに基づいてliタグを選択できます。browser.find_element_by_name(name)を使用して名前に基づいて選択することもできます。

または、本当にできない場合は、selenium+BeautifulSoupを使用してテキストを選択できます。

soup = BeautifulSoup(browser.page_source)
text = soup.find('input', re.compile=" polishpottery")
checkbox = text.parent 
# it might not exactly be parent, but you can play around with
# navigating the tree.

お役に立てれば!

于 2012-07-10T04:34:56.040 に答える