問題タブ [unicode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
20918 参照

php - PHP での「信頼できる」SMS Unicode および GSM エンコーディング

(少し更新しました)

PHP を使用した国際化の経験はあまりありません。

PHPを使用して、「関連する」テキストのみをUnicodeに変換してSMSメッセージで送信する信頼できる方法を考え出す必要があります(サービスがC#を使用して書き直されている間、一時的に)-明らかに、その時点で送信されたメッセージが送信されますプレーンテキストとして。

(標準の GSM 文字セットを使用するのではなく) すべてを Unicode 文字セットに変換することも考えられますが、それはすべてのメッセージが (160 文字ではなく) 70 文字に制限されることを意味します。

したがって、私の本当の質問は次のとおりです。メッセージが Unicode でエンコードされている必要があることを検出する最も信頼できる方法は何 ですか?

追加情報:

さて、午前中はこれに取り組みましたが、開始時よりも進んでいません (確かに、文字セット変換に関する能力が完全に不足しているためです)。したがって、ここに改訂されたシナリオがあります。

外部ソースからのテキスト SMS メッセージがあります。この外部ソースは、プレーン テキスト + Unicode スラッシュ エスケープ文字で応答を返します。たとえば、「表示された」テキスト:

テストしてみましょう

戻り値:

テストしてみましょう \u00f6\u00e4\u00fc \u00e9\u00e0\u00e8 \u05d0\u05d9\u05df \u05ea\u05de\u05d9\u05db\u05d4 \u05d1\u05e2\u05d1\u05e8\u05d9\u05ea

これで、プレーンテキスト、GSM 03.38、または Unicode で SMS プロバイダーに送信できます。明らかに、上記をプレーンテキストとして送信すると、多くの文字が欠落します (プロバイダーによってスペースに置き換えられます)。コンテンツの内容に関連して採用する必要があります。これでやりたいことは次のとおりです。

  1. すべてのテキストがGSM 03.38 コードページ内にある場合は、そのまま送信してください。(上記のヘブライ文字以外はすべてこのカテゴリに当てはまりますが、変換する必要があります。)

  2. それ以外の場合は、Unicode に変換し、複数のメッセージで送信します (Unicode の制限は、SMS の 160 文字ではなく 70 文字であるため)。

上で述べたように、私はこれを PHP で行うことに困惑しています (C# はいくつかの単純な変換関数が組み込まれているため、それほど問題ではありませんでした)。PHP で 7 ビット エンコーディング用の事前に作成された変換クラスも見つかりませんでした。文字列を自分で変換して送信しようとしても無駄に思えました。

どんな助けでも大歓迎です。

0 投票する
3 に答える
850 参照

unicode - Unicode 文字を使用した表形式データのフォーマット

中間結果を示す表形式のデータを含む計算トレース ファイルを作成する必要があります。現在、標準の ASCII パイプ記号 (|) とダッシュ (-) の組み合わせを使用して表の行を描画しています。

例えば

よりプロフェッショナルな外観のテーブルを作成するために使用できる Unicode 文字はありますか?

(ファイルは生のテキスト形式である必要があり、HTML やその他のマークアップは使用できません)

編集:提案を取り入れてUnicodeボックスの描画文字を使用したテーブルの例を追加しました:

0 投票する
4 に答える
962 参照

java - クロスプラットフォームの Unicode サポート

クロスプラットフォーム アプリで Unicode をサポートするのは本当に大変だと思います。

C コードからデータベース、Java アプリケーション、そして Perl モジュールに至る文字列が必要です。これらはそれぞれ、異なる Unicode エンコーディング (UTF8、UTF16) またはその他のコード ページを使用します。私が必要としている最大のものは、変換を行うためのクロスプラットフォームの方法です。

これらの処理を容易にするために、人々はどのような種類のツール、ライブラリ、または手法を使用していますか?

0 投票する
8 に答える
134877 参照

c# - C# で Pop3 を使用してメールを読む

C# 2.0 で Pop3 を使用してメールを読む方法を探しています。現在、CodeProjectにあるコードを使用しています。ただし、このソリューションは理想的とは言えません。最大の問題は、Unicode で書かれたメールをサポートしていないことです。

0 投票する
5 に答える
1059 参照

mysql - MySQL UTF/Unicode移行のヒント

MySQLテーブルをデフォルトのケースに依存しないスウェーデン語またはASCII文字セットからutf-8に移行しようとするときに注意すべきヒントや落とし穴はありますか?私が関わっているプロジェクトのいくつかは、より良い国際化を目指して努力しており、データベースはこの変化の重要な部分になるでしょう。

データベースの変更を検討する前に、すべての入力/出力が同じ文字セットを使用していることを確認するために、UTF-8文字エンコード(重要度の低いものから高いものへ)を使用するように各サイトを変換します。

助けてくれてありがとう

0 投票する
3 に答える
1830 参照

python - Webページから国際文字を取得しますか?

単純なPython正規表現を使用して、サッカー(サッカー)のWebページからいくつかの情報を取得したいと思います。問題は、最初のチャップ、ÄÄRITALOなどのプレイヤーがÄÄ RITALO!として出てくることです。
つまり、htmlは、Äなどの特殊文字にエスケープされたマークアップを使用します。

HTMLを正しいPython文字列に読み込む簡単な方法はありますか?XML / XHTMLの場合、それは簡単ですが、パーサーがそれを行います。

0 投票する
9 に答える
44775 参照

c++ - C++ での Unicode 処理

C++ での Unicode 処理のベスト プラクティスは何ですか?

0 投票する
4 に答える
721 参照

language-agnostic - Unicodeはもう流暢ですか?

ほぼ5年前、Joel Spolskyはこの記事を書いています、「絶対に最小限のすべてのソフトウェア開発者は絶対に、積極的にUnicodeと文字セットについて知っている必要があります(言い訳はありません!)」

多くの人と同じように、私はそれを注意深く読み、この「ASCIIの置き換え」を理解するのは時期尚早であることに気づきました。残念ながら、5年後、私はこの地域のいくつかの悪い習慣に戻ったと感じています。ありますか?

私は特に国際的なアプリケーションをあまり作成していませんが、ASP.NETインターネット向けのWebサイトの構築を支援してきたので、それは言い訳にはならないと思います。

ですから、私の利益のために(そして私は他の多くの人を信じています)、次のような人々からいくつかの意見を得ることができますか?

  • ASCIIを「乗り越える」方法
  • Unicodeを使用する際の基本的なガイダンス。
  • Unicodeに関する推奨(最近の)書籍およびWebサイト(開発者向け)。
  • Unicodeの現在の状態(Joelsの記事から5年後)
  • 今後の方向性。

私は.NETのバックグラウンドを持っていることを認めなければならないので、.NETFrameworkのUnicodeに関する情報も喜んでいます。もちろん、これは、異なる背景を持つ人がコメントするのを止めるべきではありません。

更新:以前にStackOverflowで尋ねられたこの関連する質問を参照してください。

0 投票する
7 に答える
2905 参照

asp.net - asp.netアプリケーションをグローバル化するために知っておくべきことは何ですか?

北米以外のいくつかの地域にローカライズする必要があるasp.netアプリケーションを作成しています。このグローバリゼーションに備えるために何をする必要がありますか?世界に対応したアプリケーションの作成方法を学ぶためのトップ1から2のリソースは何ですか。

0 投票する
6 に答える
43934 参照

javascript - JavaScript の国際文字

サーバーからブラウザーに XML でデータを転送する Web アプリケーションに取り組んでいます。

私はデンマーク人なので、すぐにキャラクターの問題にぶつかりますæøå

私は、html で"æøå"forを使用していることを知っていæøåます。

ただし、文字がJavaScriptを通過するとすぐに、を"?"使用すると黒いボックスが表示されæøå"æøå"そのまま印刷されます。

utf-8に設定しましたが、あまり役に立ちません。

理想的には、(自然に)特殊文字で動作することを望みます。

動作しない例を以下に示します。

私は何を間違っていますか?


OK、Grapefrukts の回答のおかげで、うまくいきました。

MySQLサーバーからのデータには実際に必要でした。ファイルを UTF-8 エンコーディングで保存しても静的コンテンツの問題のみが解決されるため、PHP を使用して抽出した MySQL サーバーからの文字列の解決策を含めたいと思います。

utf8_encode($MyStringHere)