1

URL からデータを取得する HTTP Get 要求メソッドを作成する方法を学習しましたが、Web ページ上のリンクのリストのみを表示するように応答をフィルター処理したいと考えています。

たとえば、HTML に次のテキストが含まれていたとします。

<link href="http://www.thompsons.co.uk">

次に、印刷する必要があります。

http://www.thompsons.co.uk

4

3 に答える 3

1

HTMLを「解析」するために正規表現を使用しないことを強くお勧めします。処理しているWebページのフォーマットを制御できない限り、正規表現に基づくソリューションは脆弱でバグが多い傾向があります。

代わりに、寛容なHTMLパーサーを使用してください。この質問はいくつかの選択肢を提供します: Java用のHTML/XMLパーサー

于 2012-09-06T12:24:03.127 に答える
0

データ全体を完全に読み取り、正規表現で解析してリンクを抽出します。詳細はこちら: http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/

于 2012-09-06T12:18:45.007 に答える
0

jsoupを使用できます:

http://jsoup.org/cookbook/extracting-data/attributes-text-html

于 2012-09-06T12:55:19.000 に答える