Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私はJava HTMLパーサーを探しています(Javaと私の悪いPHPをよく知っています-このようにして、HTMLパーサーがどのように機能するかを理解したいです)PHPの単純なHTML DOM。
ありがとう
jsoupを試してください。私の知る限り、これは最高のHTMLパーサーです。
実際の乱雑な HTML を取り込み、ContentHandler で SAX XML イベントをトリガーする SAX パーサーであるTagSoupを試してください。これをJDOMで使用して、手動で、または XPath を介して実行できる JDOM ドキュメントを構築することをお勧めします。