問題タブ [unicode-escapes]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Javaで生のutf形式から実際の文字を取得する方法
私はこのようにエンコードされたいくつかの中国語の文字を持っています:
文字列bを実際の文字に変更するにはどうすればよいですか。コンソールに出力すると、以下のcが表示されることがわかりました。問題は、文字列bをcに変更する方法です。
perl - Perl の文字列内の \xhh 文字のみで「'unicode-escape' をデコード」する方法は?
次の内容のファイルがあり、一部の文字は文字列リテラルでエンコードされた UTF-8 16 進数です。
ファイルを読み取り、ファイル内の UTF-8 16 進数でエンコードされた文字を実際の Unicode 文字にデコードしてから、新しいファイルに書き込みたいと考えています。上記の内容の場合、UTF-8 エンコーディングのテキスト エディターで開くと、新しいファイルは次のようになります。
二重引用符がまだエスケープされており、UTF-8 16 進エンコード\xC3\x96
が Ö (U+00D6 LATIN CAPITAL LETTER O WITH DIAERESIS) になっていることに注意してください。
次のように、部分的に機能するコードを取得しました。
ただし、問題は、 などの他のすべてのエスケープ シーケンス\"
も によってデコードされますdecode 'unicode-escape', $_
。したがって、最終的には次のようになります。
UTF-8エンコーディングでファイルを読み取ったり、次のUnicode::Escape::unescape
ようなものを使用してみました
しかし、どちらも\xhh
エスケープ シーケンスをデコードしません。
基本的に私が望むのは の動作だけですが、エスケープシーケンスdecode 'unicode-escape', $_
でのみデコードし、\xhh
他のエスケープシーケンスを無視する必要があります。
これは可能ですか?この場合、使用はdecode 'unicode-escape', $_
適切ですか? その他の方法で?ありがとう!
python - Decode 関数は Python のエンコードを試みます
特定のエンコーディング 16 進数を含まない Unicode 文字列を印刷しようとしています。UTF-8 の html ヘッダーにエンコーディング タイプを持つ facebook からこのデータを取得しています。タイプを印刷すると、Unicodeと表示されますが、unicode-escapeでデコードしようとすると、エンコードエラーがあると表示されます。デコード メソッドを使用するとエンコードしようとするのはなぜですか?
コード
bash - bashシェルスクリプトで変数のスペースに対応するにはどうすればよいですか?
うまくいけば、これは単純なものでなければなりません...これが私のtest.shファイルです:
「mydir」のスペースに注意してください。実行すると、
変数のスペースに対応し、コマンドを実行する方法がわかりません。しかし、これをbashシェルで実行すると、問題なく機能します。
どんな提案でも大歓迎です!私はWindowsでcygwinのbashを使用しています。
mysql - コマンドラインMySQLのUnicodeエスケープシーケンス
短縮版:
コマンドラインmysqlでUnicode文字を検索するために使用できるエスケープシーケンスの種類は?
長いバージョン:
コマンドラインからmysqlでUnicodeシーケンスU + 200Bを含むレコードを列で検索する方法を探しています。どの種類のエスケープを使用するかわかりません。\u200B とx200Bを試してみましたが、_utf8 構文を提案する 1 つのブログをついに見つけました。これにより、コマンドラインで次の文字が生成されます。
今、私は「LIKE」クエリでそれを機能させようとして立ち往生しています。
これにより文字が生成されますが、 % は LIKE 部分に配置すると特別な意味を失うようです:
私も連結を試みましたが、どちらもうまくいきませんでした:
より多くの背景:
幅ゼロの空白文字 (zwsp) を含むデータ、Unicode ポイント U+200B があります。これは通常、出力に zwsp を使用する Web サイトからのコピー/貼り付けが原因です。ほとんどの Unicode 文字では、文字を端末に貼り付ける (またはキーコードで作成する) だけで済みますが、これは目に見えないため、少しやりがいがあります。「%%」シーケンスを生成するファイルを作成し、それを端末にコピーして貼り付けることができます。これは機能しますが、コマンド履歴と端末出力がおかしいままになります。MySQL でこれを行う簡単な方法があると思いますが、これまでのところ不十分です。
前もって感謝します、
-ポール・バーニー
eclipse - 特殊文字をUnicodeエスケープシーケンスに置き換えるためのEclipseショートカットキー
Ecpliseに、特殊文字(アクセント付き)をUnicodeエスケープシーケンス(\ uXXXX)で置き換えることができるショートカットキーはありますか?
python - Python でのエスケープ シーケンスのエスケープ
私はpythonが初めてです。目標は、サブプロセス解析を使用してシェル コマンドを実行し、シェルから印刷された出力を取得することです。以下のサンプル出力メッセージに示すように、実行エラーが発生します。また、サンプル コード スニペットを以下に示します。
コードスニペット:
出力:
使用できる回避策または機能はありますか?
あなたの助けに感謝します ありがとう
java - 国際文字列をJavaの\uコードに変換する
\u
国際的な(ロシア語などの)文字列を数値(Unicode番号など)
に変換するにはどうすればよい\u041e\u041a
ですOK
か?
xml - lxml でエラーを発生させる /dev/random からのランダム テキスト: すべての文字列は XML 互換である必要があります: Unicode または ASCII、NULL バイトはありません
Web アプリをテストするために、/dev/random からいくつかのランダムな文字を Web フロントエンドに貼り付けています。この行はエラーをスローします:
ユーザーが入力した文字列をコミットする前に、次のことを行っています。
comment.decode('utf-8').encode('utf-8', "replace")
しかし、これはこの場合には役に立たないようです。
-- アビ