13

Java から HTML を検証するための迅速かつ簡単な方法は何ですか? 次のような 100 個の HTML タグのさまざまなプロパティを記述するオープンソース/PD クラス (またはクラスのセット) を探しています。

  1. タグはオプションですか?空の?終了タグを省略することは合法ですか?
  2. このタグには他にどのタグを含めることができますか (存在する場合)?
  3. このタグに有効な属性とそのタイプは? (必須ではありませんが、あると便利です)

ありがとう!

編集

私は HTML ドキュメントのタグごとの分析をしようとしているので、ドキュメント全体が有効かどうかにはあまり関心がありませんが、タグの種類ごとに特定の要件が何であるかに関心があります。W3C 仕様に基づいてルールをエンコードすることはできましたが、どの既製のソリューションが最初に利用可能かを確認したかったのです。

4

2 に答える 2

8

特定のタグが特定の仕様に従っていることを確認したい場合は、JavaベースのHTMLパーサーに終わりはないようです。

JavaのオープンソースHTMLパーサー

つまり、HTMLを解析してから、結果のドキュメントで探しているタグを調べて、それらが必要な仕様を満たしているかどうかを判断できます。そうでない場合は、エラーをスローするだけです。

要件を正確に念頭に置いて作成されたHTML分析ツールは見つからないと思います。主な理由は、これらの要件が表明されておらず、おそらく少し曖昧だからです。

パーサーが箱から出して必要なことを実行しない場合、少なくともこのリストはオープンソースであるため、変更を公開する限り、パーサーをハックすることができます。

于 2010-12-08T21:38:41.820 に答える
4

JTidy ( http://jtidy.sourceforge.net/ ) と VietSpider HTMLParser ( http://sourceforge.net/projects/binhgiang/ ) はどちらも Java HTML パーサーであり、いくつかの構文チェック機能を備えています。一部の Eclipse ベースの HTML エディター プラグインは、構文チェックに JTidy (または Tidy のポート) を使用します。またはDavid Saidのように、ページを w3c.org に送信します。

于 2010-12-09T04:52:26.437 に答える