0

私は何をすべきかを理解するのに少し問題があります。

基本的にJavaを使用して私がしようとしていること:

  • WebサイトからHTMLを読み取る
  • この場合、特定の文字列の後にコンテンツを検索したい

     title="
    
  • それを文字列に保存します。

最初と最後のステップは私にとっては簡単ですが、運がありません(そして正規表現を使用したことはありません)。

これが私が必要としているものの始まりだと思います。

   String regex = "(?<=title=\")\\S+";
   Pattern name = Pattern.compile(regex);

その後、私には手がかりがありません。何か助けはありますか?

4

2 に答える 2

1
import java.util.regex.Matcher;
import java.util.regex.Pattern;

String EXAMPLE_TEST = "......";
Pattern pattern = Pattern.compile("(?<=title=\")(\\S+)")
Matcher matcher = pattern.matcher(EXAMPLE_TEST);
while (matcher.find()) {
  System.out.println(matcher.group());
}

注:正規表現パターンの使用を検討することをお勧めします(?<=title=\")([^\"]*)

于 2012-07-27T17:25:29.193 に答える
0
List<String> result_list = new ArrayList<String>();
Pattern p = Pattern.compile("title=\"(.*)\"");
Matcher m = p.matcher("title=\"test\"");
boolean result = m.find();

while(result)
{
    result_list.add(m.group(0));
    result = m.find();
}
于 2012-07-27T17:30:26.407 に答える