python - textareaのコンテンツを取得する

Question

HTMLページを解析しています。それぞれにHTMLページがあります。

<textarea name="content[country]">...</textarea>

このテキストエリアのコンテンツを取得する必要があります。

私のPythonバージョンにはlxmlやその他のhtml解析モジュールはありません。これは、テキストエディター環境内で機能しているためです。

名前の付いたtextareaの開始タグと終了タグの間のテキストを解析するにはどうすればよいcontent[country]ですか？

score 0 · Accepted Answer

まだstdlibにアクセスできると仮定すると、次のようなものを使用できます。

import xml.etree.ElementTree as ET

s = '<html><textarea name="content[country]">foo</textarea><textarea name="content[country]">bar</textarea></html>'
tree = ET.fromstring(s)
print [n.text for n in tree.iterfind('.//textarea[@name="content[country]"]')]
# ['foo', 'bar']

恐ろしい再ハック：

import re
print re.findall(r'<\s*textarea.*?>(.*?)<', s)

python - textareaのコンテンツを取得する

1 に答える 1

Related

Reference