Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
いくつかの属性/タグなどの値を見つけるために、いくつかの HTML を解析したいと考えています。
どの HTML パーサーをお勧めしますか? 長所と短所はありますか?
NekoHTML、TagSoup、およびJTidyを使用すると、HTML を解析してから、XPath などの XML ツールで処理できます。
非常にシンプルなHTMLパーサーを試しました。
HTML を完全に解析する必要がありますか? コンテンツ内の特定の値 (特定のタグ/パラメーター) を探しているだけの場合は、単純な正規表現で十分であり、非常に高速になる可能性があります。