1

私は Java にあまり自信がないので、string.string から複数の部分文字列を抽出するには助けが必要です。

そこから元のテキストを抽出する必要がある、おそらく数千の同様の POS タグ付き行を含むテキスト ファイルがあります。正規表現の問題。

String="I_PRP recently_RB purchased_VBD this_DT camera_NN";

出力を取得したい= 最近このカメラを購入しました。

私が使う

正規表現:[\/](.*?)\s\b

しかし、うまくいきません。助けてください。

4

2 に答える 2

1

単語の種類 (名詞、動詞、代名詞など) を示すタグを付けているようですが、このサフィックスが常に大文字になる場合は、次の正規表現を使用する方が安全です。replaceAll

s = s.replaceAll("_[A-Z]+(?=(\\s|$))", "");
于 2013-02-09T06:22:40.330 に答える
1

試す

    String s= "I_PRP recently_RB purchased_VBD this_DT camera_NN";
    s = s.replaceAll("_\\w+(?=(\\s|$))", "");
    System.out.println(s);

版画

I recently purchased this camera
于 2013-02-09T05:56:12.193 に答える