TagSoup および jTidy ライブラリのドキュメント (可能であれば公式のドキュメント) を探しています。
このライブラリを使用して、html (html、xhtml、または html5) タグの間に異なる名前空間が混在する xml タグを含む html "tagsoup" ファイルを操作したいと考えています。
HTMLCleaner、NekoHTML、および Jericho をテストしましたが、ファイルをクリアするための最も単純な例を除けば、jTidy と TagSoup のドキュメントは見つかりません。
コンテンツの操作、タグの置換、情報の抽出などに関するドキュメントが必要です...
ありがとう
注: すべてのオプションをテストした後、StAX / Woodstoxを使用しました。