0

次のようなhtmlフォームを解析しようとしています:

<select name="country">
<option value="1">Afghanistan</option>
<option value="2">Albania</option>
<option value="3">Algeria</option>
<option value="4">Andorra</option>
....
</select>

lxml.html.parse を使用してドキュメントを解析した後、次を使用して値のリストにアクセスできます。

doc.forms[0].elements["country"].value_options

ただし、これは対応する国名を含まない生の値 (['1'、'2'、'3'、'4' ...]) のリストを返します。テキストと値の両方を含むオプション タグの内容を取得する簡単な方法はありますか?

4

1 に答える 1

1

xpathを使用してhtmlを調べます...試してみてください:

options = doc.xpath("//select[@name='country']/option")
option_text = [option.text for option in options]
于 2012-08-20T10:50:27.977 に答える