HTML ページから要素を取得するのを手伝ってくれる人はいますか? 私はライブラリを使用したくありません。正しい正規表現などを使用する方法についてのポインタが 1 つまたは 2 つ必要です。私はこれにこだわっています。すべての助けに感謝します。
質問する
67 次
2 に答える
1
まず、HTML について話しているのか XML について話しているのかを決める必要があります。
テキストが有効な XML ドキュメントである場合、JAXP を使用してドキュメントを解析し、要素/属性にプログラムでアクセスできます (正規表現は必要ありません)。
テキストが有効な XML ドキュメントでない場合、100% のケースで適切に機能するセット正規表現はありません。最善の方法は、Swing フレームワークの一部として提供されている JDK の組み込み HTML パーサーを使用することです。
于 2012-11-17T01:27:27.083 に答える
0
JDK には基本的なHTML パーサーが含まれています。あまり堅牢ではありませんが、「ライブラリを使用したくない」と指定しました。それで... ノックアウトすると思いますか?
于 2012-11-17T00:24:45.490 に答える