-3

HTML ページから要素を取得するのを手伝ってくれる人はいますか? 私はライブラリを使用したくありません。正しい正規表現などを使用する方法についてのポインタが 1 つまたは 2 つ必要です。私はこれにこだわっています。すべての助けに感謝します。

4

2 に答える 2

1

まず、HTML について話しているのか XML について話しているのかを決める必要があります。

テキストが有効な XML ドキュメントである場合、JAXP を使用してドキュメントを解析し、要素/属性にプログラムでアクセスできます (正規表現は必要ありません)。

テキストが有効な XML ドキュメントでない場合、100% のケースで適切に機能するセット正規表現はありません。最善の方法は、Swing フレームワークの一部として提供されている JDK の組み込み HTML パーサーを使用することです。

于 2012-11-17T01:27:27.083 に答える
0

JDK には基本的なHTML パーサーが含まれています。あまり堅牢ではありませんが、「ライブラリを使用したくない」と指定しました。それで... ノックアウトすると思いますか?

于 2012-11-17T00:24:45.490 に答える