文字セット間でテキスト ファイルを変換するための最も速くて簡単なツールまたは方法は何ですか?
具体的には、UTF-8 から ISO-8859-15 に、またはその逆に変換する必要があります。
お気に入りのスクリプト言語のワンライナー、コマンド ライン ツール、または OS 用のその他のユーティリティ、Web サイトなど、すべてが揃っています。
これまでのベストソリューション:
Linux/UNIX/OS X/cygwin の場合:
Troels Arvinによって提案されたGnu iconvは、フィルタとして最適に使用されます。一般的に入手可能のようです。例:
$ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt
Benが指摘したように、 iconv を使用したオンライン コンバーターがあります。
Cheekysoftが提案するrecode ( manual ) は、 1 つまたは複数のファイルをその場で変換します。例:
$ recode UTF8..ISO-8859-15 in.txt
これは短いエイリアスを使用します:
$ recode utf8..l9 in.txt
Recode は、異なる行末タイプとエンコーディング間の変換に使用できるサーフェスもサポートしています。
改行を LF (Unix) から CR-LF (DOS) に変換します。
$ recode ../CR-LF in.txt
Base64 エンコード ファイル:
$ recode ../Base64 in.txt
それらを組み合わせることもできます。
Unix 行末を持つ Base64 でエンコードされた UTF8 ファイルを Dos 行末を持つ Base64 でエンコードされた Latin 1 ファイルに変換します。
$ recode utf8/Base64..l1/CR-LF/Base64 file.txt
Windows でPowershell ( Jay Bazuzi ) を使用する場合:
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(ただし、ISO-8859-15 はサポートされていません。サポートされている文字セットは、Unicode、utf7、utf8、utf32、ascii、bigendianunicode、default、および oem であると記載されています。)
編集
iso-8859-1 サポートのことですか? 「文字列」を使用すると、たとえばその逆の場合にこれが行われます
gc -en string in.txt | Out-File -en utf8 out.txt
注: 可能な列挙値は、「Unknown、String、Unicode、Byte、BigEndianUnicode、UTF8、UTF7、Ascii」です。
- CsCvt - Kalytta の Character Set Converterは、Windows 用のもう 1 つの優れたコマンド ライン ベースの変換ツールです。