ウィキペディアには、 UnicodeのLatin 1 Supplementの下に x80—x9F "C1" 範囲のリストがあります。この範囲は、ISO-8859-1コードページでも予約されています。
\x96
文字列のファイルを見ていますが、住所の真ん中など、ダッシュのように見えるいくつかのインスタンスを除いて、すべてが 7 ビット ASCII の範囲内にあります。
C1 範囲の他の文字が最終的にデータに表示されるかどうかはわかりません。そのため、ファイルを正しく読み取る方法があるかどうかを知りたいです。端末制御文字の代わりに文字データに x80 から x9F を使用する 8 ビット エンコーディングはありますか?