2

私が通常従う2つのアプローチは次のとおりです。

  1. HTMLを文字列に変換してから、ターゲット文字列に対してテストします。このアプローチの問題は、脆弱すぎることです。たとえば、どこかに余分な空白があるなどの理由で、偽陰性が非常に頻繁に発生します。

  2. HTMLを文字列に変換し、それをXMLとして解析して戻し、XPathクエリを使用して特定のノードでアサートします。このアプローチはうまく機能しますが、すべてのHTMLに終了タグが付属しているわけではなく、そのような場合はXMLが失敗するため解析します。

これらのアプローチには両方とも重大な欠陥があります。この種のテストには、確立されたアプローチ(または複数のアプローチ)が必要だと思います。それは何ですか?

4

1 に答える 1

5

XML解析の代わりにjsoupまたはJTidyを使用して、2番目の戦略を使用することができます。

于 2013-03-20T07:15:37.167 に答える