java - hrefタグ間のJava正規表現抽出データ

Question

Java 文字列の href タグ間のデータを抽出しようとしています。これは、すべてと部分文字列を置換し、indexOf などを使用して実現できます。

正規表現を使用してデータを取得する方法を知りたいです。

基本的に、データを抽出して文字列またはリストに保存しようとしています。

String data ="12345";
        String sampleStr ="";
        for(int i=0; i<10; i++) {
         data+=i;
        sampleStr += "<a href=\"javascript:yyy_getDetail(\'"+data+"\')\">"+data+"</a>"+", ";
        }           

        System.out.println(sampleStr);
        String temp = sampleStr.substring(sampleStr.indexOf("\">")+2);

関連する提案をいただければ幸いです。正規表現であるべきなので、データのみを抽出します。

score 3 · Accepted Answer

これはあなたのニーズの例です。完全一致にはアンカータグ付きの文字列が含まれ、検索されたコンテンツはgroup 1.

String data ="12345";
String sampleStr ="";
for(int i=0; i<10; i++) 
{
 data+=i;
 sampleStr += "<a href=\"javascript:yyy_getDetail(\'"+data+"\')\">"+data+"</a>"+", ";
} 

Pattern pattern = Pattern.compile("<a[^>]*>(.*?)</a>");
Matcher matcher = pattern.matcher(sampleStr );
while (matcher.find()) 
{
        System.out.println("Result "+ matcher.group(1));
}

score 1 · Accepted Answer

代わりに HTML/XML パーサーを使用してください。あなたの人生はずっと楽になるでしょう。

通常、HTML は非常に一貫性がなく、希望どおりになるかどうか確信が持てません。

これに関して実際に有名な答えがあります。RegEx では、XHTML 自己完結型タグを除くオープンタグに一致します。

HTML/XML パーサーを使用することを選択した場合は、Java のベスト XML パーサーを参照してください:)

java - hrefタグ間のJava正規表現抽出データ

2 に答える 2

Related

Reference