わかりました、簡単な質問です。私は Java の初心者で、ページのタイトル タグから人物の名前を取得する必要があります。正規表現は知っていますが、一部の文字をエスケープできません (またはエスケープ方法がわかりません)。
例
<title>Mr. Somebody | Department in which he's in</title>
したがって、基本的に、「Mr. Somebody」を取得する正規表現が必要です。私はもう試した :
Pattern pat = Pattern.compile("<title>(.+?)|");
Matcher mat = pat.matcher(data);
boolean found = false;
while (!found && mat.find()) {
name = mat.group(0);
found = true;
}
System.out.println("Found a name : " + name);
私の問題は、何を試しても、最初のキャラクターしか得られなかったということです. indexOf と部分文字列を使用したより単純なアプローチの方が優れていると思いますか、それとも正規表現はまだ実行可能ですか?
通常、正規表現は html タグの解析には適していませんが、タグ全体 (またはタグ内に含まれる可能性のある他のタグ) には関心がないため、この検索は文字列検索に近いと考えています。
どんな種類の助けも大歓迎です:)