問題タブ [unicode-escapes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1199 参照

python - Python DELETE文字(Unicode 7F)は何もしないようです。後続の文字を削除するべきではありませんか、それとも間違っていますか?

Pythonシェルに入り、これをテストしました。結果は次のとおりです。

この文字の私の理解によれば、それはその文字列のスペースを示すべきではありませんでした。私は何が間違っているのですか?

0 投票する
1 に答える
924 参照

android - Androidで特殊文字を含むJSONデータのダンプとリロードを処理する適切な方法は?

これがすでに回答されているかどうかはわかりませんが、クイック検索では満足のいく結果が得られませんでした..
次のシナリオで立ち往生しています:

  • REST API と JSON 形式のデータ BLOB を使用する Web サービス
  • このサービスと通信し、ローカルでデータをキャッシュ/処理する Android クライアント アプリ

we サービスはドイツの会社によって運営されているため、結果データの一部の文字列にはドイツ語のウムラウトなどの特殊文字が含まれています。

アプリはローカルで、応答オブジェクトを反映する一連のクラスを使用してデータを解析しています (例:上の例のRewardクラスとRewardResponseクラス)。これらの各クラスは、JSON から / への読み取りとダンプを行うことができますが、これが厄介なところです。

上記の例では、org.json はデータを正しく解析し、結果の文字列には特殊文字 'ß' ( \u00df ) と 'ü' ( \u00fc ) の適切な Unicode バージョンが含まれます。

ご覧のとおり、JSONObject.toString()によって生成されたデータのロードに問題があります。
主に何が起こっているかというと、JSONObjectは"\uXXXX"の形式でエスケープを解析しますが、プレーンな UTF-8 テキストとしてダンプします。

次に、解析時に Unicode を適切に読み取らず、代わりに結果文字列に置換文字を挿入します (コード ポイントとして\uffffの上)。

私の現在の回避策は、Unicode Latin1 補助文字とそれぞれのエスケープ バージョン ( \u00a0から\u00ffまで) を含むルックアップ テーブルで構成されています。しかし、これはまた、何かをダンプするたびに、ダンプされたすべての JSON テキストを調べて、文字をエスケープされたバージョンに置き換える必要があることも意味します。

もっといい方法があれば教えてください!

(注:この質問がありますが、彼はディスク上のローカルファイルエンコーディングに問題がありました。
ご覧のとおり、上記の私の問題は、ディスクに書き込むことなく再現可能です)

編集:コメントで要求されているように、toJSON()メソッドは次のとおりです。

補足として、 JSONObject.toString()またはJSONStringerを使用しても違いはありません。(ドキュメントでは.toString()の使用を推奨しています)

編集:方程式から報酬を削除するだけで、これは問題を再現します:

0 投票する
2 に答える
2334 参照

java - Java で Unicode 値の文字表現を取得する

Java で Unicode 値の文字表現が必要です。これはできますか?

一部の文字 (Unicode 値が \u001b の文字など) は、XML ではサポートされていません。そのため、Unicode 値 '\u001b' を入れて XML でエスケープし、アンマーシャリング後に \u001b の文字表現を表示したいと考えています。これは Java で実行できますか?

提案は大歓迎です。

0 投票する
3 に答える
1618 参照

java - '\' Java の StringObject.ReplaceAll メソッドで自動的に削除される

Jre1.6を使用しています。次のコード行を実行しています。

文字列 unicodeValue = "\u001B"; text = text.replaceAll("" + character, unicodeValue);

ここで、テキストは、Unicode 値 '\u001B' の無効な XML 文字を含む文字列オブジェクトです。そのため、無効な XML 文字を Unicode 値に変換して XML に書き込みます。

しかし、text.replaceAll を実行すると、「\」が取り除かれ、文字が「u001B」に置き換えられます。

文字をユニコード値に置き換えた後、「\」を保持する方法を誰か提案できますか?

0 投票する
2 に答える
1349 参照

php - PHPPCREユニコードエスケープ

「\uXXXX」を含む式を含む正規表現データベースを使用しています。これはもちろん、PHPPCREを壊します。

では、2つの部分からなる質問ですが、PCREにこれらのシーケンスを受け入れるように指示する方法はありますか?

そして、私はこの問題を回避しました。幸いなことに、それは1つのシーケンスだけでした。

$ regx = str_ireplace('\ u00a7'、'\ xa7'、$ regx);

しかし、私がやろうとしていたとき:

$ regx = preg_replace( "/ \\ u(\ w +)/ i"、 "\ x $ 1"、$ regx);

私はまだ得ていた-

警告:preg_replace()[function.preg-replace]:コンパイルに失敗しました:PCREはオフセット1で\ L、\ l、\ N {name}、\ U、または\uをサポートしていません

そして、単に\\ uではなく、\ u => \\\\ uを二重にエスケープする必要がありました。なぜそれが/より良い方法があるのでしょうか?注:この投稿に正しい文字列を取り込むには、実際には同じことを行う必要がありました。

更新:サーバーで5.3.3を実行

0 投票する
1 に答える
1123 参照

ios - 文字のUnicode値の範囲をチェック

Objective-C では...

「Δ」のような文字がある場合、どうすればユニコード値を取得し、それが特定の値の範囲内にあるかどうかを判断できます。

たとえば、特定の文字が から の Unicode 範囲にあるかどうかを知りたいU+1F300場合U+1F6FF

0 投票する
1 に答える
658 参照

ruby - コマンドライン引数としてRuby Unicodeエスケープ

この質問は Python 開発者 (コマンドライン引数としての Unicode エスケープの入力を許可する) によって尋ねられたようですが、これは部分的に関連していると思いますが、Ruby での差し迫った問題の解決策を完全には得られません。エスケープされた Unicode シーケンスをコマンド ライン引数として取得し、変数に代入してから、エスケープされた Unicode を処理し、スクリプトの実行後に通常の Unicode として表示する方法があるかどうか興味があります。基本的に、Unicode 番号を選択できるようにしたいので、Ruby にそれをファイル名に貼り付けて、実際の Unicode 文字を表示させます。

問題の原因となるいくつかの点を以下に示します。

文字列を Unicode シーケンスとして処理するために必要なスラッシュが取り除かれます。次に、別の「\」を追加してエスケープしようとすると、

それでも適切に処理されません。

実際にこれを実現しようとしている、より関連性の高いコードを次に示します。

これはかなり単純なはずですが、検索して検索しましたが、解決策が見つかりません。追加する必要がありますが、ハードコードされたエスケープされた Unicode を文字列に指定すると、 のようFile.new("\u263a.#{filetype}", "w")に問題なく動作することはわかっていますが、引数/変数から取得することで問題が発生しています。Ruby 1.9.2 を使用しています。

0 投票する
1 に答える
67437 参照

python - python2.7の文字列内のUnicode \u2026のような文字を削除する

私はこのようにpython2.7に文字列を持っています、

これに変換するにはどうすればよいですか、

0 投票する
1 に答える
380 参照

php - カタロニア文字 à および è は php imagestringup では機能しません - それらをデコードするには?

スペイン語で $text を使用して以下のコードを呼び出すと、画像で正しいテキストが得られましたが、カタロニア語で $text を使用して同じコードを呼び出すと、画像に正しいテキストが表示されません。スペイン語の特殊文字á と éは機能していますが、カタロニア語の文字à と èは機能していません。

この問題を解決するのを手伝ってくれませんか。