中国の投稿を含むxmlファイルを作成していますが、動作しているように見えましたが、エラーが発生し始めました:
このページには次のエラーが含まれています:
25 列目の 4165 行目のエラー: 入力が適切な UTF-8 ではありません。エンコーディングを示してください! バイト: 0x0B 0xC3 0xA5 0xC2 以下は、最初のエラーまでのページのレンダリングです。
結果のファイルのいくつかを開こうとすると、それが参照する行に漢字が含まれており、これは特定の状況でのみ発生し、テキストにはそれを台無しにする文字が含まれていることがあると思います。そのフィールドのテキストが常に適切にエンコードされるようにするにはどうすればよいですか? なぜ問題なのか、まだわかりません。
Public Shared xwriter As XmlTextWriter = New XmlTextWriter(xmlfile, Encoding.UTF8)
xmltextwriter が適切に宣言されていることを確認します。
編集:
問題は、私がvb.netを使用していて、明らかにすべてがutf-16でエンコードされているため、これで問題ないと思います。問題は、受け取ったテキストがおそらく二重にエンコードされているか、正しくエンコードされていないため、使用する前にきれいにする必要があることです。私のxmlが有効になるように。
編集:
したがって、データを修正する必要がある場合、特定のテキストに使用されているエンコーディングを検出する方法と、xml ファイルで表示できる utf8 形式に変換してファイルを有効にする方法を質問します。