Java が HTML の同等性を測定するために使用する優れたライブラリを誰かが知っているかどうか疑問に思っています。
たとえば、<td class="one two three" name="goat">
と同等<td name="goat" class="three two one">
です。Javaを使用して、このようにhtmlの行の多い文字列全体を比較したいと思います。
助言がありますか?
アップデート:
そこで、XmlUnit の Diff.similar() を使用してみましたが、これら 2 つが似ていることがわかりました。
<html three="3" two="2" one="1"></html>
と<html one="one" two="two"></html>
これは望ましくない動作です...他に選択肢はありますか?