Shift-JIS 文字セットを使用してファイルを作成すると問題が発生します。
これは、txt ファイルに書き込みたいテキストの例です。
繰戻し_日経選挙システム保守2019年1月10日~;[2019年度更新]横浜第1DCコロケ―ション(2ラック)
Shift-JIS 文字セットを使用すると、ファイルに 2 つの「?」が見つかります。~と―の代わりに:
繰戻_日経選挙システム保守2019年1月10日?;[2019年度更新]横浜第1DCコロケ?ション(2ラック)</p>
UTF-8 文字セットを使用して、見つけたファイルに (すべて正しい):
繰戻し_日経選挙システム保守2019年1月10日~;[2019年度更新]横浜第1DCコロケ―ション(2ラック)
これは私のコードです:
package it.grupposervizi.easy.ef.etl.elaboration;
import com.nimbusds.jose.util.StandardCharset;
import java.io.File;
import java.io.IOException;
import java.nio.charset.Charset;
import java.util.Arrays;
import java.util.List;
import org.apache.commons.io.FileUtils;
public class TestShiftJIS {
private static final String TEXT = "繰戻_日経選挙システム保守2019年1月10日~;[2019年度更新]横浜第1DCコロケ―ション(2ラック)";
private static final String DIRECTORY = "C:\\temp\\japan\\";
private static final String SHIFT_JIS = "Shift-JIS";
private static final String UTF_8 = StandardCharset.UTF_8.name();
private static final String EXTENSION = ".txt";
public static void main(String[] args) {
final List<String> charsets = Arrays.asList(SHIFT_JIS, UTF_8);
charsets.forEach(c -> {
final String fName = DIRECTORY + c + EXTENSION;
File file = new File(fName);
try {
FileUtils.writeStringToFile(file, TEXT, Charset.forName(c));
} catch (IOException e) {
throw new RuntimeException(e);
}
});
System.out.println("End Test");
}
}
これら 2 つの文字が Shift-JIS 文字セットに含まれていない理由がわかりましたか?