[エクスポート] -> [関連ファイル] を選択して、 OECD http://stats.oecd.org/Index.aspx?datasetcode=CRS1 ('CRS 2013 data.txt')からファイルをダウンロードします。このファイルを Ubuntu (14.04 LTS) で使用したいと考えています。
私が実行すると:
dos2unix CRS\ 2013\ data.txt
そうですか:
dos2unix: Binary symbol 0x0004 found at line 1703
dos2unix: Skipping binary file CRS 2013 data.txt
ファイルのエンコーディングを次のようにチェックします。
file --mime-encoding CRS\ 2013\ data.txt
そして見てください:
CRS 2013 data.txt: utf-16le
そうです:
iconv -l | grep utf-16le
何も返さないので、次のようにします。
iconv -l | grep UTF-16LE
戻り値:
UTF-16LE//
次に実行します:
iconv --verbose -f UTF-16LE -t UTF-8 CRS\ 2013\ data.txt -o crs_2013_data_temp.txt
そしてチェック:
file --mime-encoding crs_2013_data_temp.txt
そして見てください:
crs_2013_data_temp.txt: utf-8
それから私は試します:
dos2unix crs_2013_data_temp.txt
そして得る:
dos2unix: Binary symbol 0x04 found at line 1703
dos2unix: Skipping binary file crs_2013_data_temp.txt
私はそれを強制しようとします:
dos2unix -f crs_2013_data_temp.txt
つまり、dos2unix はベイル アウトや文句を言わずに変換を完了しますが、ファイルを開くと、「FoâŤa and ÄŚajniÄŤe」のようなエントリが表示されます。
私の質問はなぜですか?BOM が dos2unix から見えないからですか? 無くなったから?変換を正しく行っていませんか? このファイルを読み取れるように変換するにはどうすればよいですか (正しくは?)。