奇妙な問題があります。
名前のリストを取得するために Web ページをクロールするアプリケーションがあります。このリストは、それらの名前を使用する別のアプリケーションに渡され、その API を使用してサイトに情報を要求します。
最初の Web ページの一部の文字列を、API によって取得された他の一部の文字列と比較すると、通常、間違った結果が得られます。
文字値を文字ごとに取得しようとしましたが、次のようになりました。
Rocco De Nicola
82 111 99 99 111 160 68 101 32 78 105 99 111 108 97 1st web page
82 111 99 99 111 32 68 101 32 78 105 99 111 108 97 2nd
ご覧のとおり、最初の文字列では、スペースが 32 ではなく 160 (改行なしスペース) でコード化されています。
文字列の最初のセットを正しく体系化できますか?
Charset を UTF-8 に設定しようとしましたが、うまくいきませんでした。
多分私は 160 を 32 に置き換える必要がありますか?