13

いくつかの属性/タグなどの値を見つけるために、いくつかの HTML を解析したいと考えています。

どの HTML パーサーをお勧めしますか? 長所と短所はありますか?

4

3 に答える 3

12

NekoHTMLTagSoup、およびJTidyを使用すると、HTML を解析してから、XPath などの XML ツールで処理できます。

于 2008-08-25T19:22:20.160 に答える
7

非常にシンプルなHTMLパーサーを試しました。

于 2008-08-25T18:55:11.427 に答える
1

HTML を完全に解析する必要がありますか? コンテンツ内の特定の値 (特定のタグ/パラメーター) を探しているだけの場合は、単純な正規表現で十分であり、非常に高速になる可能性があります。

于 2008-08-25T18:56:36.540 に答える