以下の Java 正規表現の正しい構文を取得する際に問題が発生しています。文字列を検索して、3 つの単一引用符で始まり、3 つの単一引用符で終わるテキストのチャンクが含まれているかどうかを確認したいと思いますが、その前後に他のテキストを含めることができます。3 つの単一引用符の間に任意の UTF-8 文字を含めることができます。私が間違っていたアイデアはありますか?
String value="'''<html><head><title>Hello World</title></head><body><div>text</div></body></html>'''";
Pattern p = Pattern.compile("'''[\\w*]'''");
Matcher m = p.matcher(value);
if(m.find()){
System.out.println("''' found");
}else{
System.out.println("''' not found");
}