CSVファイルを読んでいて、次のような値があります
field 1 field 2 field 3
1 test case1 expecting one, and \"two\", and three
ファイルをに読み込んStringBuilder
で変換した後toString()
、ファイルの内容を次のように分割しますstring.split(",(?=([^\"]*\"[^\"]*\")*[^\"]*$)");
。
文字列を繰り返すと、次の値が得られます:-
1
test case1
expecting one, and ""two"", and three
この「2」のように、2つの二重引用符を1つの二重引用符に置き換えるにはどうすればよいですか。
これが私のコードです:-
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
public class csvStringParser {
/**
* @param args
* @throws IOException
*/
public static void main(String[] args) throws IOException {
// TODO Auto-generated method stub
String path = "E:/spc.csv";
String read = readFile(path);
System.out.println("content of the file before \" = \n" +read);
// System.out.println("content of the file after= \n" +read);
String[] tokens = read.split(",(?=([^\"]*\"[^\"]*\")*[^\"]*$)");
for(int i = 0;i<tokens.length;i++) {
String abc = tokens[i].replace("\"\"", "\"");
// if(abc.length()>2){
if(abc.startsWith("\"") && abc.endsWith("\"")){
abc = abc.substring(1, abc.length()-1);
}
// }
System.out.println("> "+abc);
}
}
public static String readFile( String file ) throws IOException {
BufferedReader reader = new BufferedReader( new FileReader (file));
String line = null;
StringBuilder stringBuilder = new StringBuilder();
String ls = System.getProperty("line.separator");
while( ( line = reader.readLine() ) != null ) {
stringBuilder.append( line );
stringBuilder.append( ls );
}
return stringBuilder.toString();
}
}