問題タブ [xml-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
88 参照

xml - Rightmove XML エンティティ

XMLファイルを介してRightmoveにデータを提供するサイトがあります。ただし、特殊文字が奇妙な記号で表示されるという小さな問題が発生しています。たとえば、スマート クォートをデータ ソース (Drupal CMS) に貼り付けると、文字は「または」として表示されます。

文字問題の例

私たちのデータベース テーブルは utf8_general_ci を使用しており、私たちのサイトではすべて問題ないように見えます。Rightmove で適切な文字を表示するにはどうすればよいですか?

0 投票する
1 に答える
435 参照

java - VTD-XML : XMLModifier.output() が IndexOutOfBoundsException をスローする

VTD-XML を使用して xml ファイルを変更しようとしました。xml は Java (JAX-WS) Web サービスから文字列として受信されました。サーバーからの http 応答ヘッダーのコンテンツ タイプは、 text/xmlおよびcharset = utf-8です。

コードは次のとおりです。

xml の上の宣言は次のとおりです。

これが、getDataFromFile()メソッドでUTF-16のファイルからバイトを読み取っている理由です。それ以外の場合、コードはUTF-16 エンコーディングに切り替えることができないことを示す例外をスローします。

上記のコードは次の例外をスローします。

ファイルのエンコーディングをUTF-8に変更し、それに応じてgetDataFromFile()メソッドを変更すると (つまり、エンコーディングまたはUTF-8 を encoding として指定せずにファイルからバイトを読み取る)、すべて正常に動作します。

どんな助けでも大歓迎です。

0 投票する
1 に答える
394 参照

xml - golang encoding/xml を使用した GML のアンマーシャリング エラー

XML、実際には Geography Markup Language (GML) を非整列化しようとしています。

http://play.golang.org/p/qS6GjCOtHFに例があります

最初の 2 つの問題:

タグ "boundedBy>Envelope>lowerCorner" を持つ xml の main.FeatureCollection フィールド "LowerCorner" の読み取りエラーが、タグ "boundedBy>Envelope" を持つフィールド "Envelope" と競合します

それを修正する方法がわかりません。私はそれらをコメントアウトし、エラーなしで GML をアンマーシャリングFeaturesしましたが、FeatureCollection.

手がかりはありますか?

GML の例は次のとおりです。

私の構造体

0 投票する
3 に答える
924 参照

xml - Atom XML フィードを解析するとき、競合する CDATA 要素とエンティティ エスケープ要素をどのように処理する必要がありますか?

Atom フィード パーサーは、フィード内の次の XML 行をどのように処理する必要がありますか。

議論のために、本来意図されたテキストが実際にはJohnson & Johnson. この問題に関するこのオンライン ディスカッションに出くわしましたが、2 つの異なる意見があるようです。

1. 意見 #1 - このコンテンツは二重にエンコードされていると主張しています。テキスト「Johnson & Johnson」テキストは、エンティティ エスケープされており、CDATA セクションでラップされることによって再度エンコードされています。彼は、適切に動作する xml パーサーは を返すと述べていますJohnson & Johnson。これは、XML 仕様で CDATA エンコード データを処理する方法が規定されているためです。

  1. 意見 2 - Atom 仕様が優先されると主張する。彼は、CDATA がパススルーとして機能すると述べています。Johnson & Johnsonとして出てきJohnson & Johnsonます。これが単なる XML ドキュメントである場合は、そこで終わります。ただし、これは Atom であるため、適切な動作を判断するにはAtom 仕様を確認する必要があります。アトムの仕様では、type="html"contains エンティティ エスケープされた html を含むすべての要素が指定されています。したがって、それを自由に解読する必要があります。

事実として正しいのはどれ? 適切な Atom XML パーサーは以下を生成する必要があります か?Johnson & JohnsonまたはJohnson & Johnson、この特定の状況を考えると?

0 投票する
0 に答える
167 参照

c# - サポートされていないエンティティ参照を含む US-ASCII でエンコードされた XML の処理

この質問はこのページの続きです

プロセス:関連するプロセス。XML ファイルを開き、特定のノードでいくつかの変更を行い、別の場所に保存します。

問題に直面しています: XML でいくつかの変更を行った後に保存すると、サポートされていないエンティティ参照が にö変換されöます。ソースのエンティティをそのまま保持したい ( ö)

とは同じ文字ですが、ソース xml にそのまま保持する必要がありますöö

XML ソース

期待される出力

今すぐ取得する

マイコード

0 投票する
0 に答える
473 参照

java - Java で XML の Unicode HTML エンティティをデコードする方法

実装に使用できるライブラリはありますunescapeUnicodeHtmlか? そうでない場合、それを実装する最良の方法は何ですか?

0 投票する
2 に答える
1085 参照

coldfusion - HTML のエスケープとエスケープ解除

私が制御していない関数で、データが返されています

後でやりたい

問題は、すべての HTML タグがエスケープされていることです。

検討しました

しかし、これらが互いに逆であるかどうかはわかりません