カンマ区切りのペア文字列を分割しようとしていますが、包括的カンマに対応する方法がわかりません。
これが私のテストケースです-
private void stringSplit() {
String value = "{aaa=1111,bbb=2222,ccc=3333}";
String regEx = "[^,]+=[^,]+";
String separator = "=";
final Pattern pattern = Pattern.compile(regEx);
final Matcher matcher = pattern.matcher(value);
while (matcher.find()) {
final String group = matcher.group();
final String key = group.substring(0, group.indexOf(separator));
final String val =
group.substring(
group.indexOf( separator ) + separator.length(),
group.length());
System.out.println("key [" + key + "], val [" + val + "]");
}
}
そしてここに私の結果があります-
key [{aaa], val [1111]
key [bbb], val [2222]
key [ccc], val [3333}]
これまでのところすべて良い...
ただし、数値にコンマが含まれている場合があります。
"{aaa=11,11,bbb=2222,ccc=333,3}";
私が望む結果は-
key [{aaa], val [11,11]
key [bbb], val [2222]
key [ccc], val [333,3}]
正規表現の第一人者の誰かがここで私を助けてくれませんか。
ありがとう!
編集
@bmorris591からさらにコメントが続きます。
わかりました。最後のクエリがあります。これは、このクレイジーな正規表現(+少しのJavaコード)が処理する必要があるものの決定的なリストです。
これが私のコードです-
private void stringSplit() {
String value = "{1=\"1, one\", 22=\"+t,w,o\", 333=\"three, \"3\", -33,,333,\", 4444=\"four. '4-4, (44), -44\"}, 555=\"\", \"666\"=6666, \"777\"=\"7777\"}";
String regex = "[^\\{,]+=([[\\w]\\(\\)\\-\\+\\.\"'\\s,]+)[,}]";
String separator = "=";
final Pattern pattern = Pattern.compile(regex);
final Matcher matcher = pattern.matcher(value);
while (matcher.find()) {
final String group = matcher.group();
showKeyAndValue(group, separator);
}
}
private void showKeyAndValue(final String group, final String keyValueSeparator) {
System.out.println("group [" + group + "]");
final String key = removeQuotesFromString(group.substring(0,
group.indexOf(keyValueSeparator)));
final String val = removeQuotesFromString(group.substring(
group.indexOf(keyValueSeparator)
+ keyValueSeparator.length(), group.length()));
System.out.println("key [" + key + "], val [" + val + "]");
}
private String removeQuotesFromString(final String str) {
String returnString = str.trim();
if (returnString.startsWith("\"")) {
returnString = returnString.substring(
returnString.indexOf("\"") + 1, returnString
.lastIndexOf("\""));
}
return returnString;
}
そしてここに結果があります-
group [1="1, one",]
key [1], val [1, one]
group [ 22="+t,w,o",]
key [22], val [+t,w,o]
group [ 333="three, "3", -33,,333,",]
key [333], val [three, "3", -33,,333,]
group [ 4444="four. '4-4, (44), -44"}]
key [4444], val [four. '4-4, (44), -44]
group [ 555="",]
key [555], val []
group [ "666"=6666,]
key [666], val [6666,]
group [ "777"="7777"}]
key [777], val [7777]
キー666を除いて、すべての結果は正しいです。ご覧のとおり、末尾にコンマがあります。これで(引用符で囲まれていない値(基本的には数値))これを取り除くことができますが、これは「よりクリーンな」ソリューションになるため、正規表現でこれを実現できるかどうか疑問に思っていました...
何か考えていただければ幸いです。