問題タブ [unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
3204 参照

python - 複数の文字エンコーディングを含む文字列の処理

この質問を実際にどのように行うべきか正確にはわかりません。また、答えを見つけるにはほど遠いので、誰かが私を助けてくれることを願っています.

リモート ホストに接続し、バイト データを受信する Python アプリを作成しています。このデータは、Python の組み込み struct モジュールを使用して解凍します。文字列には複数の文字エンコーディングが含まれているため、私の問題は文字列にあります。このような文字列の例を次に示します。

"^Lこれは、複数の ^Jcharacter エンコーディングを持つ ^Gstring の例です"

異なるエンコーディングが開始および終了する場所は、特別なエスケープ文字を使用してマークされます。

  • ^L - ラテン語 1
  • ^E - 中央ヨーロッパ
  • ^T - トルコ語
  • ^B - バルト海
  • ^J - 日本語
  • ^C - キリル文字
  • ^G - ギリシャ語

などなど... この種の文字列を Unicode に変換する方法が必要ですが、その方法が本当にわかりません。私は Python のコーデックと string.encode/decode について調べましたが、実際にはそれほど賢明ではありません。また、ホストによって文字列がどのように出力されるかを制御できないことにも言及する必要があります。

誰かがこれを始める方法を手伝ってくれることを願っています。

0 投票する
5 に答える
24343 参照

php - PHP 関数 imagettftext() とユニコード

PHP 関数 imagettftext() を使用して、テキストを GIF 画像に変換しています。変換中のテキストに、日本語を含む Unicode 文字が含まれています。ローカル マシン (Ubuntu 7.10) ではすべて正常に動作しますが、Web ホスト サーバーでは日本語の文字が壊れています。違いの原因は何ですか?すべてを UTF-8 でエンコードする必要があります。

ウェブホスト サーバー上の壊れた画像: http://www.ibeni.net/flashcards/imagetest.php

ローカル マシンからの正しい画像のコピー: http://www.ibeni.net/flashcards/imagetest.php.gif

私のローカル マシンからの phpinfo() のコピー: http://www.ibeni.net/flashcards/phpinfo.php.html

ウェブホスト サーバーからの phpinfo() のコピー: http://example5.nfshost.com/phpinfo

コード:

0 投票する
5 に答える
1554 参照

c++ - C++ コードでの UTF の使用

UTF と UCS の違いは何ですか。

C++ 文字列で (UTF を使用して) ヨーロッパ以外の文字セットを表す最良の方法は何ですか。あなたの推奨事項を知りたい:

  • コード内の内部表現
    • 実行時の文字列操作用
    • 文字列を表示目的で使用するため。
  • 最適なストレージ表現 (つまり、ファイル内)
  • 最適なオン ワイヤ トランスポート形式 (異なるアーキテクチャ上にあり、異なる標準ロケールを持つアプリケーション間の転送)
0 投票する
4 に答える
1309 参照

file - Unicode ファイルのバイト オーダー マーカーを設定するにはどうすればよいですか?

これが「実際の」プログラミングの質問ではないことはわかっています。でも、それはプログラミングに関係するので、とにかく設定します。ファイルのバイト オーダー マーカーを読み取って、それが utf-8 か utf-16 かを確認するテストが必要なプログラムがあります。私の問題は、バイト オーダー マーカーを設定できるプログラム/テキスト エディターが見つからないことです。これをテキストファイルに設定する方法を誰か教えてもらえますか?

0 投票する
7 に答える
78458 参照

java - Java/Eclipse で特殊文字を使用する方法

Java/Eclipse で ♥、♦、♣、♠ などの文字を使用/表示するにはどうすればよいですか?

ソースコードなどでそれらを直接使用しようとすると、Eclipse はファイルを保存できません。

私に何ができる?

編集:どうすればユニコードエスケープシーケンスを見つけることができますか?

0 投票する
5 に答える
2247 参照

regex - Perl の Unicode 文字列で完全に構成された文字のみを一致させるにはどうすればよいですか?

Unicode 文字列内の完全に構成された文字のみを一致させる方法を探しています。

[:print:]この文字クラスを組み込んだ正規表現の実装では、ロケールに依存していますか? たとえば、日本語の「あ」は制御文字ではないため一致しますか、それとも[:print:]常に ASCII コード 0x20 ~ 0x7E になりますか?

制御文字以外のものと一致させるために使用できる、Perl RE を含む文字クラスはありますか? [:print:]ASCII範囲の文字のみが含まれている場合、私もそうすると思い[:cntrl:]ます。

0 投票する
2 に答える
834 参照

vba - VBA エディタのマクロン

中国語の語彙を復習するために使用できる、VBA を使用した簡単なプログラムを作成しています。

これまでのところ、かなりの作業を行ってきましたが、「ā」(Unicode 257) などのマクロン文字を入力する際に​​大きな問題が発生しました。私が現在取り組んでいる特定のアプリケーションには、テキスト ボックスに入力したときに "a" が自動的に置き換えられるように、テキスト ボックス フォームの内容を変更することが含まれます。このような手順自体は簡単です。ピンイン文字 "á" と "à" を使用して動作させることができます。

前の例は、Mid 関数を使用して、テキスト ボックス文字列内の 1 文字を、ユーザーからの適切な合図でピンイン文字に置き換える試みです。

問題は、VBA に「ā」を入力できないことです。私はインターネットを見回してきましたが、これは他の誰にとっても問題のようには見えません。VBA エディタで alt + 0257 を入力しても何も起こりません。メモ帳からコピー&ペーストすることもできません..VBAをスクラップして、このアプリケーションを他の言語でやり直す準備ができています..

乾杯

0 投票する
1 に答える
8133 参照

c++ - 4 バイトの UTF-8 文字を入力するにはどうすればよいですか?

さまざまなバイト長の utf-8 文字でテストする必要がある小さなアプリを作成しています。

たとえば、次のようにして、1、2、および 3 バイトの utf-8 でエンコードされた Unicode 文字を入力してテストできます。

しかし、どうすれば 4 バイトでエンコードされた Unicode 文字を取得できますか? 私が試してみました:

私が理解している限り、出力する必要があります。しかし、それを印刷するとᴶ0になります

私は何が欠けていますか?

編集:

先行ゼロを追加して動作させました:

もっと早く考えていればよかったです:)

0 投票する
1 に答える
241 参照

c++ - CMapStringToOb::Lookup が日本語の文字で機能しない

なぜCMapStringToOb::Lookup日本語で機能しないのか誰か知っていますか?このコードは、文字列テーブルから文字列を読み込み、それを CMapStringToOb オブジェクトに入れます。後で、文字列テーブルから同じ文字列をロードし (したがって、まったく同じであることが保証されます)、CMapStringToOb::Lookupそれを見つけるために呼び出します。CMapStringToOb オブジェクトで文字列を見つけることができない日本語を除いて、翻訳してテストしたすべての言語で動作します。ありがとう

0 投票する
3 に答える
1767 参照

vba - テキストがキリル文字であるかどうかをどのように判断できますか?

私の迷惑メールフォルダは、キリル文字のように見えるもので構成されたメッセージでいっぱいになっています。メッセージ本文またはメッセージの件名がキリル文字である場合、それを完全に削除したいと思います。

画面にキリル文字が表示されますが、Outlook内でVBAのメッセージを繰り返すと、メッセージの「件名」プロパティに疑問符が返されます。

メッセージの件名がキリル文字であるかどうかを確認するにはどうすればよいですか?

(注:「InternetCodepage」プロパティを調べました。通常は西ヨーロッパです。)