タイトル要素内のテキストを抽出し、それ以外はすべて無視しようとしています。
これらの記事を見てきましたが、役に立たないようです:\
角括弧の間にテキストを抽出する正規表現
Java Java Regexで文字列パターンマッチングを使用
して、HTMLアンカーからテキストを取得します(<a> ... </a >)タグ
主な問題は、自分のコードをハックしようとしているときに、レスポンダーが何を言っているのか理解できないことです。
これが、 Patternの記事でJavaAPIを読んで管理したものです。
<title>(.*?)</title>
これがタイトルを返すための私のコードです。
String title = null;
Matcher match = Pattern.compile("[<title>](.*?)[</title>]").matcher(this.webPage);
try{
title = match.group();
}
catch(IllegalStateException e)
{
e.printStackTrace();
}
IllegalStateExceptionが発生します。これは次のようになります。
java.lang.IllegalStateException: No match found
at java.util.regex.Matcher.group(Matcher.java:485)
at java.util.regex.Matcher.group(Matcher.java:445)
at BrowserModal.getWebPageTitle(BrowserModal.java:21)
at BrowserTest.main(BrowserTest.java:7)
21行目は「title=match.group();」になります。