0

[a-zA-Z] 以外のすべてが区切り文字として設定されているテキストをトークン化したい場合、Java で sringtokenizer をどのように記述すればよいでしょうか? 次のようになりますStringTokenizer st = new StringTokenizer(data, "[[^a-z]&&[^A-Z]");

4

2 に答える 2

2

正規表現を試す[^a-zA-Z]+

String text = "hello, world^ i love: #66 you";
for (String str : text.split("[^a-zA-Z]+")) {
    System.out.println(str);
}
于 2013-01-17T18:02:26.470 に答える
0

次のような否定先読みベースの正規表現を使用します。

String[] arr = data.split("(?i)(?![a-z]).");

?i - ignore case
?! - Negative lookahead

これが意味することは、az または AZ 以外の任意の文字を区切ることです。

于 2013-01-17T17:58:36.963 に答える