1

ロシアのデータベースからエクスポートされた大きな csv テキスト ファイルがあります。文字セットは OEM 866 で、ファイルの操作に使用するほとんどのアプリケーションで読み取ることができません。UTF-8 または ANSI に変換する方法はありますか?

私の試みた解決策:

1) Notepad++ で文字セットをキリル文字 OEM 866 として識別します。ファイルは Notepad++ で読み取れるようになりました。2) Notepad++ で、UTF-8、BOM なしの UTF8、ANSI に変換しようとしました。当然のことながら、Notepad++ は、作成したばかりの変換済みの "ANSI" または "UTF" ファイルを読み取ります。しかし、他のプログラムはそうではありません。

これがばかげた質問である場合は申し訳ありません-私はこの主題についてあまり知らないので.

4

2 に答える 2

1

Notepad++ が UTF-8 でエンコードされたファイル、特にそれが作成したファイルを読み取ることができる場合、UTF-8 でエンコードされたファイルをサポートする他のアプリも同じファイルを読み取ることができるはずです。すべてのアプリがテキスト ファイルの UTF-8 BOM をサポートしているわけではありませんが、BOM が存在する場合と存在しない場合でまだ問題がある場合は、UTF-8 ファイルの問題を疑う前に、それらのアプリの問題を調べる必要があります。これらのアプリは、そもそもテキスト ファイルを UTF-8 として読み込んでいない可能性が高く、その場合、ファイルの内容を正しく解釈していません。多くのアプリは、UTF-8 やその他のエンコーディングではなく、OS のデフォルトの Ansi エンコーディングが使用されていると仮定して、8 ビットのテキスト ファイルをロードする傾向があります。 (そのようなオプションが利用できない場合、BOM の出番です)。

于 2013-08-04T21:38:15.893 に答える
-1

Unix を使用している場合は、tchrist の iconv が最適なオプションのように思えますが、Notepad++ を使用しているため、Windows を使用していると思います。

おそらく手動の回避策は必要ありませんが、他の誰もより良い回避策を投稿していないため、ここに私のために働いたクラッジがあります.

ファイルを Notepad++ で開きます。エンコーディングが正しく設定されていることを確認してください ([エンコーディング] --> [文字セット] --> [キリル文字] --> [OEM 866] をクリックします)。

全選択、コピー。通常の古いメモ帳を開きます。ペースト。

[ファイル --> 名前を付けて保存] をクリックし、保存する前に、保存ボタンの横にある [エンコード] オプションが UTF-8 であることを確認してください。(ANSI がデフォルトですが、キリル文字はありません)

Notepad ++での保存がうまくいかなかった理由はわかりませんが、私はあなたと同じ経験をしました.

于 2013-08-29T14:01:14.017 に答える