0

コードを使用して取得した HTML ドキュメントを操作する必要がある場合、Java 用の適切な DOM API とは何ですかHttpURLConnectionDOM パーサー以外の jsoup も http 接続を実行できることに気付きました。より複雑な http リクエストに適したものはありますか?

4

1 に答える 1

3

私の答えを 2 文にすると: (A)アプリケーションの設計に、ネットワーク接続と DOM 解析を混在させないでください。(B) JSoupを使用すれば準備完了です。

詳細は次のとおりです。

(A) (1) DOM 解析と (2) HTTP 接続の処理という 2 つの要件を混在させることはお勧めできません。もちろん、あなたの状況はわかりませんが、維持するのが難しい不明確な設計になってしまう可能性があります。たとえば、HTTPS に移行する場合は、パーサーがそれを処理できることに依存できます。

(B) そうは言っても、HTML ドキュメントを扱っている場合は、有効な XHTML だけでなく、不完全なマークアップも処理できることに関心があるでしょう。

stackoverflow に関するその他の関連する質問 (例: thisまたはthis ) があり、それらは次のツールに要約されます。

  • HTML ページを XHTML に準拠するようにクリーンアップする
  • DOM 解析、
  • 両方の組み合わせ。

最も使用されているツールは

また、便宜上、オープン ソースの Java HTML パーサーのリストも示します

パーサーが URL 接続を処理する必要があるとまだ感じている場合は、「より複雑な http リクエスト」の意味をより詳細に指定できますか?

HTH

于 2013-09-04T14:35:41.000 に答える