私が通常従う2つのアプローチは次のとおりです。
HTMLを文字列に変換してから、ターゲット文字列に対してテストします。このアプローチの問題は、脆弱すぎることです。たとえば、どこかに余分な空白があるなどの理由で、偽陰性が非常に頻繁に発生します。
HTMLを文字列に変換し、それをXMLとして解析して戻し、XPathクエリを使用して特定のノードでアサートします。このアプローチはうまく機能しますが、すべてのHTMLに終了タグが付属しているわけではなく、そのような場合はXMLが失敗するため解析します。
これらのアプローチには両方とも重大な欠陥があります。この種のテストには、確立されたアプローチ(または複数のアプローチ)が必要だと思います。それは何ですか?