通常のスペース文字の代わりに UTF-8 NO-BREAK SPACE (C2A0) を含む UTF8 テキストを解析していますが、これが NSXMLParser で問題を引き起こしています。
たとえば、3 つの通常の空白文字を含む「I am a string」は、文字列全体として parser:(NSXMLParser *)parser foundCharacters:(NSString *)string に渡されます。
ただし、通常のスペースの代わりに 3 つの NO-BREAK-SPACES を含む「私は文字列です」と、4 つの部分文字列を含む parser:(NSXMLParser *)parser foundCharacters:(NSString *)string が 4 回呼び出されます。
「私は文字列です」を抽出したいだけですが、これらのUTF8文字に遭遇した場合、NSURLConnectionが部分文字列に分割されないようにするための適切な解決策はありますか?
入力を制御することはできません-サーバーからUTF8でエンコードされたXML over HTTPとして送信されます。