大きなプレーンテキストファイルからすべての郵便住所を抽出する簡単なプログラムを作成すると、住所の一部に標準外の文字が使用されているという問題が発生します。
これは、処理する必要があるファイルのソース テキストです。
Rua Vale de Louro, N=BA 97 Bloco 2, 1=BA A
しかし、それは読む必要があります:
Rua Vale de Louro、Nº 97 Bloco 2、1º A
明らかに、この1文字を簡単に置き換えることができますが、すべての文字で動作させる必要があります.
BA は utf32 の º 記号の 16 進値です (ただし、その前にゼロの負荷があります)。したがって、文字列内のこれらすべての「=xx」インスタンスを見つけて、それらを解決する正しい utf 文字に置き換えるように何かをコーディングできればそれ。しかし、私の人生では、方法がわかりません。
誰でも助けてもらえますか?
ありがとう