“unicode-escapes”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

61 参照

escaping - 文字コードページ: 「(このソースコードで) 次にレンダリングされる文字はエスケープされるか?」を意味するコードページの割り当てを制御します。

私は、この質問が答えられないか、答えるのが非常に難しいかもしれないことを認めます.

また、この読者はスクリプト言語などのエスケープシーケンスに精通していると思いますが、明確にするために、この記事の後半でその概念を確認します。

「エスケープされた」とは、たとえば、「次の文字を通常どおり使用しないでください。別のコンテキストで解釈してください」と解釈される印刷可能な文字を意味します。このコンテキストには、コードとして解釈されるのではなく、リテラルの印刷された文字として解釈されることを意図した文字、または逆に、コードとしてではなく解釈したいリテラル文字として通常解釈される可能性のある文字が含まれます。私の例 (より紛らわしいことに、私は今気づきました) は後者のケースを使用しています。

具体例: 'nix sed で使用される正規表現。sed 用にエスケープされていない場合は、次のようになります。

しかし、sed が文字をリテラル文字としてではなく正規表現コードとして解釈することを知っているように、シェルが正規表現を sed に渡すためにエスケープされると、文字列全体がはるかに醜くなります (そして人間が読める可能性ははるかに低くなります):

エスケープ文字 (またはシーケンス) は、プログラミングの悩みの種の 1 つです。これは特に、長い文字列 (またはコード行) に当てはまります。このような場合は、細心の注意を払うか、エスケープシーケンスを作成および削除するツールを使用することが実際的です。

私は周りを見回しましたが、私が提案するような解決策に遭遇しませんでしたが、これが存在する場合に名前が付けられる可能性があることを知らず、専門家ではないため、検索は無駄でした.

「コードページの割り当てを制御する」などと言う場合、説明したように、コンピューターがテキストのレンダリングとレイアウトの制御に使用する、印刷可能な (および印刷不可能な) 文字のテーブルの意味でのコードページについて話している。「コードページ」に関するウィキペディアの記事。必要に応じて、これらを (大まかに) 「コンピューターアルファベット」と呼ぶことができます。「コードページの割り当て」とは、レンダリングされたグリフ (印刷可能な文字) または印刷されていない制御コード (印刷不可能な文字) として解釈されるコンピューターの「アルファベット」のエントリを意味します。

アイデアは、特定の印刷されていない制御コードページの割り当てを指定して、「次の文字をエスケープされたものとして解釈する」ことを意味し、テキストレンダラーがそれを「読み取って」、エスケープされた文字の色や明るさなどを変更することでプログラマーに示すことができるようにすることです。制御コードに続きます。および/または制御コードページの割り当ては、印刷可能なグリフである可能性があります。たとえば、ローマ字に関連するアルファベットの他のアクセントと競合しない、標準化された邪魔にならないアクセントグリフです。

この印刷されていないコードページの割り当ても、同様にインタプリタとコンパイラによって読み取られます。

私が上で与えたものよりも長い正規表現のレンダリングされたバージョンを考えてみましょう:

「次の文字がエスケープされる」ことを意味する印刷されていないコードページ割り当てがある場合、エスケープされた文字は、エスケープされていることを示すために、たとえば単純に明るくレンダリングできます。

これは、代わりにエスケープシーケンスに印刷された文字を使用する次のものよりも、人間が解釈するのがはるかに簡単です (ただし、これを正規表現として開始するのは困難です)。

私がこれを書いているとき、普遍的ではないにしても支配的な状況は、印刷されていないコードページの割り当てではなく、エスケープシーケンスで印刷された文字を使用することです。

提案されたソリューションに付随する問題は、プログラマーが使用する非常に多くのツールによるエスケープされたコードページの割り当てへの準拠を保証することです。また、プログラマーは、エスケープされたコードページの割り当てをサポートするユーティリティとサポートしないユーティリティを把握する必要があります。また、そのようなコードページの割り当てを採用するツールは、下位互換性があるかどうか (エスケープシーケンスに印刷された文字と印刷されていないコードページの割り当ての両方を使用できるかどうか) を明示することが最善です。

エスケープ制御コードページの割り当て以外の方法でこれを実現するプログラミング言語やツールは好みません。それでも、これを行うツールについては非常に興味があります。

結局のところ、私の質問は、これを行うプログラミング言語が存在するか、またはこれを行うコードページ割り当てが既に存在するかということです。

2016-02-07T21:16:59.570

0 投票する

1 に答える

808 参照

php - 10 進数字参照 (NCR) &#xxxxx として表示される MySQL エントリを検索する方法は?

次のようなクエリでMySQLデータベースを検索しているとき：

SELECT * FROM mytable WHERE mytable.title LIKE '%副教授%';

("副教授" は 3 つの漢字で、10 進数字参照 (NCR) は " 副教授")、結果が得られませんでした。

phpMyadmin を調べて "mytable" を参照すると、見つかるはずのエントリが " 副教授" として表示されます。それが検索の失敗の理由だと思います。

同じ列のすべてのエントリが数字参照であるとは限らず、一部は通常の文字参照です。これは、phpMySQLAdmin に表示されるテーブル列の 1 つの写真です。

NCR に表示されているかどうかに関係なく、1 つの形式を使用して MySQL のテーブル内のすべてのエントリを検索するにはどうすればよいでしょうか。または、スクリプトを実行して NCR エントリを変換する必要がありますか? ありがとう。

php mysql unicode unicode-escapes ncr

2016-02-14T13:54:46.717

0 投票する

1 に答える

2681 参照

go - バックスラッシュでエンコードされた Unicode 文字を含む文字列をデコードする方法は?

次のように保存された文字列がありますa：

に変換する方法はありaますbか?

go escaping unicode-escapes rune

2016-02-20T04:26:25.277

0 投票する

0 に答える

228 参照

xml - エスケープ URL - XML - ライブタイル - UWP

C# には System.Security.SecurityElement.Escape(url) がありますが、BackgroundTask ではこれにアクセスしません。私は試してみます：

url= url.Replace("&", "&").Replace("<", "<").Replace(">", ">").Replace("\"", """).Replace("'", "'");

しかし、この方法は非常に退屈です。ネイティブメソッドでこれを行う方法はありますか? 最初に書いたように。

UrlEncode は私にとってユーティリティではありません。エスケープ URL が必要なだけです。

(私はこのリンクに基づいています: http://weblogs.sqlteam.com/mladenp/archive/2008/10/21/Different-ways-how-to-escape-an-XML-string-in-C.aspx )

何か案が？

前もって感謝します

xml win-universal-app windows-10 live-tile unicode-escapes

2016-04-04T10:50:04.390

0 投票する

3 に答える

2074 参照

java - 2 つのゼロの隣にヌルバイトをエスケープする

static final として定義された次のシーケンスをエスケープする必要があります

.concat()メソッドも+文字列演算子も使用せずに、これをどのようにエスケープしますか?

これは有効ではなく、最初のものと同じではありません。

これもそうではありません。

java unicode-escapes

2016-04-11T19:51:47.137

0 投票する

1 に答える

241 参照

groovy - 三重引用符で囲まれた文字列内の "\1" が Unicode 0x1 コードポイントに評価されるのはなぜですか

text を含む String が必要\1でした。

私がしたことは（実際の文字列はもっと長いですが、重要ではありません）：

その結果、Unicode0x1コードポイントを含む文字列が生成されました。

私がすべきだったのは、次のようにバックスラッシュをエスケープすることだと思います:

私が理解できないのは、Groovy がここでエラーを報告しなかった理由です。Unicodeエスケープは次のようになるはず\u1だと思いましたか？

この文字列を XML 要素に入れようとしたときに、構文エラーの代わりに実行時例外が発生しました。

groovy heredoc unicode-escapes

2016-05-13T16:45:40.900

0 投票する

2 に答える

714 参照

javascript - js ユニコード文字 `\u1F310` をレンダリングできません

たとえば、オメガ記号は適切'\u03A9'にレンダリングされますが、地球記号 '\u1F310' http://www.fileformat.info/info/unicode/char/1f310/index.htm - ではありません。コンソールとノード環境で試した

javascript unicode character-encoding unicode-escapes unicode-literals

2016-05-17T09:53:55.060

問題タブ [unicode-escapes]

Reference