データを取得しようとしているサイトがあり、コンテンツは次のようにレイアウトされています。
<p uri="/someRandomURL.p1" class="">TestData TestData TestData</p>
<p uri="/someRandomURL.p2" class="">TestData1 TestData1 TestData1</p>
私はJavaを使用してWebページのコンテンツを取得しており、次のように解析しようとしています:
Pattern p = Pattern.compile(".*?p1' class=''>(.*?)<.*");
Matcher m = p.matcher(data);
//Print out regex groups to console
System.out.println(m.group(1)) ;
しかし、一致するものが見つからないという例外がスローされます...
私の正規表現は正しいですか?他に何が起こっている可能性がありますか?私はhtmlをうまく取得していますが、どうやら私の正規表現に一致するものはありません...
ありがとう