"<p class=a> ... </p>"
where...が異なるテキストの複数のオカレンスを含む文字列があります。
正規表現パターンを使用し"<p class=a>(.*)</p>"
て、テキストをチャンクに分割しています。しかし、これは機能していません。これの正しい正規表現は何でしょうか?
PS同じ正規表現パターンがNSRegularExpressionを使用してiOSで機能していますが、Patternを使用してAndroidでは機能していません。
私の問題をもっと説明するために:私は次のことをしています
Pattern regex3 = Pattern.compile("(?s)<P Class=ENCC>(.*?)</P>", CASE_INSENSITIVE);
String[] result = p.split(str);
結果の配列には1つの項目のみが含まれ、それは文字列全体です
以下は私が読んでいるファイルの一部です:
<BODY>
<SYNC Start=200>
<P Class=ENCC><i>Cerita, Watak, Adegan dalam</i><br/><i>Drama Ini Rekaan Semata-Mata.</i></P>
</SYNC>
<SYNC Start=2440>
<P Class=ENCC> </P>
</SYNC>
<SYNC Start=2560>
<P Class=ENCC><i>Kami Tidak Berniat</i><br/><i>Melukakan Hati Sesiapa.</i></P>
</SYNC>
<SYNC Start=4560>
<P Class=ENCC> </P>
</SYNC>
<SYNC Start=66160>
<P Class=ENCC>Hai kawan-kawan.<br/>Inilah bandaraya Banting.</P>
</SYNC>
アップデート ::::
みなさん、こんにちは。問題が発生しました。問題は、実際には私が読んでいたファイルのエンコーディングにありました。ファイルはUTF-16(リトルエンディアン)でエンコードされていました。それは正規表現が機能しないというすべての問題を引き起こしていました。私はそれをUTF-8に変更し、すべてが機能し始めました..皆さんのサポートに感謝します。