文字列を含むファイルがいくつかあり、perl でそれらを UTF8 に変換する必要があります。これらのファイルを実行し、すべての文字列を utf8 に変換する perl のオプションはありますか?
7762 次
2 に答える
5
ファイルの一部は UTF-8 を使用してエンコードされ、一部は別のものを使用してエンコードされていると言いましたが、他のエンコードを指定していませんでした。これは重要です。
一般的に言えば、文字列を見てエンコーディングを判断することは不可能です。しかし、US-ASCII、iso-8859-1、cp1252、および UTF-8 が混在している場合は、実際にそのことがわかり*、誰かが既にそのツールを作成している可能性があります。
Encoding::FixLatinfix_latin
には、上記のエンコーディングが混在するファイルを UTF-8 に変換するという名前のスクリプトが付属しています。
于 2012-04-30T04:01:40.920 に答える
2
Encodeモジュールを使用して、エンコーディング間の変換を行うことができます。(何もインストールする必要はありません。これはコア ライブラリの一部です。) 「文字列を UTF-8 に変換する」には、変換元のエンコーディングを知っている必要があることに注意してください。8 ビットのテキスト エンコーディングを確実に識別する方法はありません。
于 2012-04-30T00:24:21.017 に答える