2

次の文字列がありMBRB1045T4G、Javaの正規表現で除外したいと思います。どうすればそれを達成できますか?

弦:

<p class="ref">
<b>Mfr Part#:</b>
MBRB1045T4G<br>


<b>Technologie:</b>&nbsp;
    Tab Mount<br>



<b>Bauform:</b>&nbsp;
    D2PAK-3<br>



<b>Verpackungsart:</b>&nbsp;
    REEL<br>



<b>Standard Verpackungseinheit:</b>&nbsp;
    800<br>

4

1 に答える 1

3

Wrikkenが正しく言っているように、一般的なケースでは、HTMLを正規表現で正しく解析することはできません。しかし、あなたは実際のウェブサイトを見ていて、いくつかのコンテンツを削りたいようです。その場合、HTMLコードのスペース要素とフォーマットが変更されないと仮定すると、次のような正規表現を使用できます。

 Mfr Part#:</b>([^<]+)<br>

そして、そのように最初のキャプチャグループを収集します(stringHTMLはどこにありますか):

Pattern pt = Pattern.compile("Mfr Part#:</b>\s+([^<]+)<br>",Pattern.MULTILINE);
Matcher m = pt.matcher(string); 
if (m.matches())
    System.out.println(m.group(1)); 
于 2012-05-08T16:43:35.617 に答える