問題タブ [unicode-escapes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
126 参照

java - Javaで生のutf形式から実際の文字を取得する方法

私はこのようにエンコードされたいくつかの中国語の文字を持っています:

文字列bを実際の文字に変更するにはどうすればよいですか。コンソールに出力すると、以下のcが表示されることがわかりました。問題は、文字列bをcに変更する方法です。

0 投票する
1 に答える
2395 参照

perl - Perl の文字列内の \xhh 文字のみで「'unicode-escape' をデコード」する方法は?

次の内容のファイルがあり、一部の文字は文字列リテラルでエンコードされた UTF-8 16 進数です。

ファイルを読み取り、ファイル内の UTF-8 16 進数でエンコードされた文字を実際の Unicode 文字にデコードしてから、新しいファイルに書き込みたいと考えています。上記の内容の場合、UTF-8 エンコーディングのテキスト エディターで開くと、新しいファイルは次のようになります。

二重引用符がまだエスケープされており、UTF-8 16 進エンコード\xC3\x96が Ö (U+00D6 LATIN CAPITAL LETTER O WITH DIAERESIS) になっていることに注意してください。

次のように、部分的に機能するコードを取得しました。

ただし、問題は、 などの他のすべてのエスケープ シーケンス\"も によってデコードされますdecode 'unicode-escape', $_。したがって、最終的には次のようになります。

UTF-8エンコーディングでファイルを読み取ったり、次のUnicode::Escape::unescapeようなものを使用してみました

しかし、どちらも\xhhエスケープ シーケンスをデコードしません。

基本的に私が望むのは の動作だけですが、エスケープシーケンスdecode 'unicode-escape', $_でのみデコードし、\xhh他のエスケープシーケンスを無視する必要があります。

これは可能ですか?この場合、使用はdecode 'unicode-escape', $_適切ですか? その他の方法で?ありがとう!

0 投票する
3 に答える
5901 参照

python - Decode 関数は Python のエンコードを試みます

特定のエンコーディング 16 進数を含まない Unicode 文字列を印刷しようとしています。UTF-8 の html ヘッダーにエンコーディング タイプを持つ facebook からこのデータを取得しています。タイプを印刷すると、Unicodeと表示されますが、unicode-escapeでデコードしようとすると、エンコードエラーがあると表示されます。デコード メソッドを使用するとエンコードしようとするのはなぜですか?

コード

0 投票する
2 に答える
8061 参照

bash - bashシェルスクリプトで変数のスペースに対応するにはどうすればよいですか?

うまくいけば、これは単純なものでなければなりません...これが私のtest.shファイルです:

「mydir」のスペースに注意してください。実行すると、

変数のスペースに対応し、コマンドを実行する方法がわかりません。しかし、これをbashシェルで実行すると、問題なく機能します。

どんな提案でも大歓迎です!私はWindowsでcygwinのbashを使用しています。

0 投票する
2 に答える
3513 参照

mysql - コマンドラインMySQLのUnicodeエスケープシーケンス

短縮版:

コマンドラインmysqlでUnicode文字を検索するために使用できるエスケープシーケンスの種類は?

長いバージョン:

コマンドラインからmysqlでUnicodeシーケンスU + 200Bを含むレコードを列で検索する方法を探しています。どの種類のエスケープを使用するかわかりません。\u200B とx200Bを試してみましたが、_utf8 構文を提案する 1 つのブログをついに見つけました。これにより、コマンドラインで次の文字が生成されます。

今、私は「LIKE」クエリでそれを機能させようとして立ち往生しています。

これにより文字が生成されますが、 % は LIKE 部分に配置すると特別な意味を失うようです:

私も連結を試みましたが、どちらもうまくいきませんでした:

より多くの背景:

幅ゼロの空白文字 (zwsp) を含むデータ、Unicode ポイント U+200B があります。これは通常、出力に zwsp を使用する Web サイトからのコピー/貼り付けが原因です。ほとんどの Unicode 文字では、文字を端末に貼り付ける (またはキーコードで作成する) だけで済みますが、これは目に見えないため、少しやりがいがあります。「%%」シーケンスを生成するファイルを作成し、それを端末にコピーして貼り付けることができます。これは機能しますが、コマンド履歴と端末出力がおかしいままになります。MySQL でこれを行う簡単な方法があると思いますが、これまでのところ不十分です。

前もって感謝します、

-ポール・バーニー

0 投票する
4 に答える
4451 参照

eclipse - 特殊文字をUnicodeエスケープシーケンスに置き換えるためのEclipseショートカットキー

Ecpliseに、特殊文字(アクセント付き)をUnicodeエスケープシーケンス(\ uXXXX)で置き換えることができるショートカットキーはありますか?

0 投票する
2 に答える
756 参照

python - Python でのエスケープ シーケンスのエスケープ

私はpythonが初めてです。目標は、サブプロセス解析を使用してシェル コマンドを実行し、シェルから印刷された出力を取得することです。以下のサンプル出力メッセージに示すように、実行エラーが発生します。また、サンプル コード スニペットを以下に示します。

コードスニペット:

出力:

使用できる回避策または機能はありますか?

あなたの助けに感謝します ありがとう

0 投票する
12 に答える
114052 参照

java - 国際文字列をJavaの\uコードに変換する

\u国際的な(ロシア語などの)文字列を数値(Unicode番号など)
に変換するにはどうすればよい\u041e\u041aですOKか?

0 投票する
1 に答える
4682 参照

xml - lxml でエラーを発生させる /dev/random からのランダム テキスト: すべての文字列は XML 互換である必要があります: Unicode または ASCII、NULL バイトはありません

Web アプリをテストするために、/dev/random からいくつかのランダムな文字を Web フロントエンドに貼り付けています。この行はエラーをスローします:

ユーザーが入力した文字列をコミットする前に、次のことを行っています。

comment.decode('utf-8').encode('utf-8', "replace")

しかし、これはこの場合には役に立たないようです。

-- アビ