問題タブ [xml-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - Rightmove XML エンティティ
XMLファイルを介してRightmoveにデータを提供するサイトがあります。ただし、特殊文字が奇妙な記号で表示されるという小さな問題が発生しています。たとえば、スマート クォートをデータ ソース (Drupal CMS) に貼り付けると、文字は「または」として表示されます。
私たちのデータベース テーブルは utf8_general_ci を使用しており、私たちのサイトではすべて問題ないように見えます。Rightmove で適切な文字を表示するにはどうすればよいですか?
java - VTD-XML : XMLModifier.output() が IndexOutOfBoundsException をスローする
VTD-XML を使用して xml ファイルを変更しようとしました。xml は Java (JAX-WS) Web サービスから文字列として受信されました。サーバーからの http 応答ヘッダーのコンテンツ タイプは、 text/xmlおよびcharset = utf-8です。
コードは次のとおりです。
xml の上の宣言は次のとおりです。
これが、getDataFromFile()メソッドでUTF-16のファイルからバイトを読み取っている理由です。それ以外の場合、コードはUTF-16 エンコーディングに切り替えることができないことを示す例外をスローします。
上記のコードは次の例外をスローします。
ファイルのエンコーディングをUTF-8に変更し、それに応じてgetDataFromFile()メソッドを変更すると (つまり、エンコーディングまたはUTF-8 を encoding として指定せずにファイルからバイトを読み取る)、すべて正常に動作します。
どんな助けでも大歓迎です。
xml - golang encoding/xml を使用した GML のアンマーシャリング エラー
XML、実際には Geography Markup Language (GML) を非整列化しようとしています。
http://play.golang.org/p/qS6GjCOtHFに例があります
最初の 2 つの問題:
タグ "boundedBy>Envelope>lowerCorner" を持つ xml の main.FeatureCollection フィールド "LowerCorner" の読み取りエラーが、タグ "boundedBy>Envelope" を持つフィールド "Envelope" と競合します
それを修正する方法がわかりません。私はそれらをコメントアウトし、エラーなしで GML をアンマーシャリングFeatures
しましたが、FeatureCollection
.
手がかりはありますか?
GML の例は次のとおりです。
私の構造体
xml - Atom XML フィードを解析するとき、競合する CDATA 要素とエンティティ エスケープ要素をどのように処理する必要がありますか?
Atom フィード パーサーは、フィード内の次の XML 行をどのように処理する必要がありますか。
議論のために、本来意図されたテキストが実際にはJohnson & Johnson
. この問題に関するこのオンライン ディスカッションに出くわしましたが、2 つの異なる意見があるようです。
1.
意見 #1 - このコンテンツは二重にエンコードされていると主張しています。テキスト「Johnson & Johnson」テキストは、エンティティ エスケープされており、CDATA セクションでラップされることによって再度エンコードされています。彼は、適切に動作する xml パーサーは を返すと述べていますJohnson & Johnson
。これは、XML 仕様で CDATA エンコード データを処理する方法が規定されているためです。
- 意見 2 - Atom 仕様が優先されると主張する。彼は、CDATA がパススルーとして機能すると述べています。
Johnson & Johnson
として出てきJohnson & Johnson
ます。これが単なる XML ドキュメントである場合は、そこで終わります。ただし、これは Atom であるため、適切な動作を判断するにはAtom 仕様を確認する必要があります。アトムの仕様では、type="html"
contains エンティティ エスケープされた html を含むすべての要素が指定されています。したがって、それを自由に解読する必要があります。
事実として正しいのはどれ? 適切な Atom XML パーサーは以下を生成する必要があります
か?Johnson & Johnson
またはJohnson & Johnson
、この特定の状況を考えると?
c# - サポートされていないエンティティ参照を含む US-ASCII でエンコードされた XML の処理
この質問はこのページの続きです
プロセス:関連するプロセス。XML ファイルを開き、特定のノードでいくつかの変更を行い、別の場所に保存します。
問題に直面しています: XML でいくつかの変更を行った後に保存すると、サポートされていないエンティティ参照が にö
変換されö
ます。ソースのエンティティをそのまま保持したい ( ö
)
とは同じ文字ですが、ソース xml にそのまま保持する必要がありますö
。ö
XML ソース
期待される出力
今すぐ取得する
マイコード
java - Java で XML の Unicode HTML エンティティをデコードする方法
実装に使用できるライブラリはありますunescapeUnicodeHtml
か? そうでない場合、それを実装する最良の方法は何ですか?
coldfusion - HTML のエスケープとエスケープ解除
私が制御していない関数で、データが返されています
後でやりたい
問題は、すべての HTML タグがエスケープされていることです。
検討しました
しかし、これらが互いに逆であるかどうかはわかりません