問題タブ [utf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
14173 参照

unicode - UTF-8、UTF-16、UTF-32では格納できる文字数に違いはありますか?

わかった。これは典型的な「なぜ彼はググったり、www.unicode.orgに行って調べたりしなかったのか?」のように見えることはわかっています。質問ですが、そのような単純な質問の場合、両方の情報源を確認した後でも答えはわかりません。

これら 3 つのエンコーディング システムはすべて Unicode 文字をすべてサポートしていると確信していますが、プレゼンテーションでそれを主張する前に確認する必要があります。

おまけの質問: これらのエンコーディングは、拡張してサポートできる文字数に違いがありますか?

0 投票する
5 に答える
1554 参照

c++ - C++ コードでの UTF の使用

UTF と UCS の違いは何ですか。

C++ 文字列で (UTF を使用して) ヨーロッパ以外の文字セットを表す最良の方法は何ですか。あなたの推奨事項を知りたい:

  • コード内の内部表現
    • 実行時の文字列操作用
    • 文字列を表示目的で使用するため。
  • 最適なストレージ表現 (つまり、ファイル内)
  • 最適なオン ワイヤ トランスポート形式 (異なるアーキテクチャ上にあり、異なる標準ロケールを持つアプリケーション間の転送)
0 投票する
1 に答える
340 参照

python - Python でテキストを変換できるように、シリアル デバイスで使用されるカスタム コード ページを実装するにはどうすればよいですか?

カスタム コード ページから ASCII または (特定のコードを使用して) 文字でメッセージを取得するスクロール LED サインがあります。

たとえば、ユーロ記号は次のように送信する必要があります。

そして ä は

(ドキュメントで完全なコード ページを見つけることができます)

私の質問は、このカスタム コード ページを実装し、UTF 文字列をカスタム コード ページに変換できるコーデックを持つ最も Pythonic な方法は何ですか?

0 投票する
4 に答える
1865 参照

c++ - Windows の wchar_t と GCC/Linux の間で (必ずしもプログラムで) 変換する方法は?

この Windows wchar_t 文字列があるとします。

UTF-32 AFAIKであるGCC / Linux wchar_t形式に変換したいと思います(必ずしもプログラムで行う必要はありません。これは1回限りのことです)。どうすればいいのですか?(一般的な説明はいいでしょうが、この具体的なケースに基づく例も役に立ちます)

文字変換サイトに誘導しないでください。「終了文字」形式ではなく、L"\x(何か)" 形式から変換したいと考えています。

0 投票する
3 に答える
590 参照

php - PHPのUTF8で文字列に国際文字とスペースしか含まれていないことを確認するにはどうすればよいですか?

Pythonでは、Unicodeに変換して、'(?u)^ [\ w] + $'正規表現検索を実行できましたが、PHPは国際的な\wを理解していないようです。

0 投票する
3 に答える
2696 参照

php - 文字エンコーディングは MAMP サーバーでは機能するようですが、WAMP サーバーでは機能しないようです

私は、複数の言語でタグと検索クエリを受け入れることができる Web アプリケーションに取り組んできました。それはあまりにも多くを求めていませんよね?

今、私の開発 MAMP サーバーでは、すべてが素晴らしいです。多言語タグを追加したり、任意の言語で検索したりします。

一方、実稼働の WAMP サーバーでは、多言語文字が問題を引き起こします。そして、常にではなく、時々、または一部のキャラクターでさえ、まだわかりません.

何が起こるかというと、余分な文字が取得され、URL のデコードが適切に行われないということです。

どちらの環境も、PHP 5、MySQL、および Apache を使用します。

私の推測では、どこかで設定を間違えたのだと思います。

何か案は?

  • 更新:特定の文字だと確信しています(たとえば、ヘブライ語のל、מא)

  • 更新: 簡単に再現可能: 常に同じ文字のエンコードが間違っています。

  • コンテンツタイプはtext/html; charset=utf-8

また、私はそれをもう少し正確に特定しました:
は検索文字列を使用します :

  • アドレス バーの検索フレーズは正しく、適切に URL エンコードされています。
  • HTML 自体には、" " である " �_יבני "という文字列が表示されます%D7_%D7%99%D7%91%D7%A0%D7%99。これは、ל%D7_が本来あるべき" " ではなく" " にエンコードされたことを意味し%D7%9Cます。

さらにどこに行けばいいのかわからない。
何か案は?誰でも?

0 投票する
2 に答える
322708 参照

unicode - Unicode、UTF、ASCII、ANSI 形式の違い

、、、、、、、およびエンコーディングUnicodeの違いはUTF8何ですか?UTF7UTF16UTF32ASCIIANSI

これらはプログラマーにとってどのように役立ちますか?

0 投票する
4 に答える
1474 参照

unicode - 補助機は必要ですか?

質問は非常に単純だと思います。基本プレーンの後に Unicode の残りのすべてが必要ですか? どのようなものが含まれており、それは本当に必要ですか? (そして何の目的で?)

ありがとう。