問題タブ [non-unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - libc++ と VC++: wstring_convert で非 UTF 変換を実行できますか?
C++11は、標準の UTF-8 <-> UTF-16/UCS2/UCS4 変換にstd::wstring_convert
最適です。*
ただし、からではないファセットを使用して wstring_convert または wbuffer_convert をインスタンス化しようとすると、<codecvt>
期待どおりに機能しませんでした。
Clang ++は、「〜wstring_convertでcodecvt <>の保護されたデストラクタを呼び出しています」というエラーを出します
Visual Studio ではそれが可能です (ただし、そのロケールはありませんが、それは別の話です)。これは、その wstring_convert がメンバーとして保持するロケール オブジェクトへのファセット ポインターの有効期間管理をポーンし、ロケールがすべてのファセットへのポインターを削除する方法を知っているためです。
Visual Studio は正しく、libc++ は間違っていますか?
*
clang++-2.9/libc++-svn および Visual Studio 2010 EE SP1 で実装されているように、次の例は両方で機能しますが、悲しいことに GCC では機能しません: https://ideone.com/hywz6
unicode - Unicode を使用する場合 (非 Unicode は別として!)
正確に Unicode をいつ使用するかについての (簡潔な) 情報はあまり見つかりませんでした。ベスト プラクティスは常に Unicode を使用することだと多くの人が言うことは理解しています。しかし、Unicode 文字列はより多くのメモリ フットプリントを持っています。Unicode は次の場合にのみ使用する必要があると言うのは正しい ですか?
- ローカル以外での画面への出力 (デバッグなど)。
- 一般に、両端が異なるロケール/国にあるネットワークを介して任意のタイプのテキストを送信する
- どれを使えばいいかわからないとき
誰かが Unicode で実際に何が起こるかの基本(簡潔) を説明してくれれば有益だと思います。
- 物理(バイト)文字列は、送信者とは異なる文字列の表現(コードページ、その他...これは興味深いがすでに詳細です)を使用してマシンに送信されます。
コンテキストはプログラミング言語 (C++ など) で Unicode を使用していますが、この質問への回答があらゆるエンコーディング状況に使用できることを願っています。
また、Unicode と NLS が同じものではないことは承知していますが、NLS は Unicode の使用を暗示していると言うのは正しいですか?
PS 素晴らしいサイト
asp.net - Web サーバー上の非 Unicode ファイル名
最近、社内にイントラネットのWebアプリケーション(Open Atrium)を導入することにしたのですが、すぐに困ってしまいました。ギリシャ語 (非 Unicode) と英語のファイル名が混在する巨大なディレクトリ - サブディレクトリ ファイル システムがあります。Apache も IIS も、ブラウザを介してこれらのファイルの読み取りまたは書き込みを処理できないようです。
私が達成しようとしているのは、読み取り中、特にアップロード中にファイル名をそのまま保持することです。
注: ファイルの名前を変更すると意味が失われるため、音訳プロセスはオプションではありません。したがって、既存のファイルの量は膨大であり、名前を変更することはできません。
だから、私の質問は次のとおりです。この問題を適切に処理する他のサーバー (JSP など) はありますか?
前もって感謝します
私の構成は、Windows 上の Xampp、Drupal 6、Open Atrium です。
sql-server - 非 Unicode テキストを含む SSMS のテーブルをスクリプト化する方法
ユニコードではなく 8 ビット文字 (nvarchar ではなく varchar) を使用してテキストを格納する SQL Server のいくつかのテーブルを使用しています。一定量のテキストには、ASCII 範囲外の値を持つ文字が含まれています。たとえば、中引用符、全角ダッシュ、および ñ などの国際文字です。すべての PC とサーバーが同じコード ページを使用しているため、おそらくこれが機能します。
ただし、SSMS で [タスク] > [スクリプトの生成] スクリプト ツールを使用してこのようなテーブルのスクリプトを作成すると、結果のスクリプトは特殊文字を変換し、スクリプトを使用してテーブルを再構築すると、特殊文字が破損します。たとえば、「カニョン」は「カニオン」になります。これは、スクリプトに含まれる INSERT ステートメントで確認できます。データベースの「cañon」は、INSERT ステートメントでは「ca±on」と表示されます。
SSMS で、ラウンドトリップが機能するように、ASCII 範囲外の varchar データを含むテーブルをスクリプト化するにはどうすればよいですか?
jquery - divにユニコード文字があるかどうかをJQUERYでどのように理解できますか
少なくとも1つのUNICODE文字を含むWebページ内のすべてのオブジェクトを認識したい。
このようにして、UNICODE文字を含む要素に対して特定のCSSクラスを実行したいと思います(完全にUNICODEであるか、NON-UNICODEとUNICODEが一緒に含まれている可能性があります。たとえば、英語とアラビア語のdivが含まれています)。
ブラウザのクライアント側でJQUERYを介してこれを行う方法はありますか?
案内してください。
どうもありがとう。
php - 非Unicode、非英語コンテンツをUnicodeに変換する
「xyz」言語のテキストコンテンツがあります。
ここで、フォントxyz(xyz.ttf)は非ユニコードです。
次に、その「XYZ」(xyz.ttf)フォントテキストをユニコード「PQR」(pqr.ttf)フォントに変換したいと思います。
単純に、非ユニコード中国語(non_uni_chinese.ttf)からユニコード中国語(uni_chinese.ttf)
どうすればphpを使用してそれを可能にすることができますか。何か助けはありますか?
python - キリル文字(ロシア語)を操作しながらUnicodeEncodeErrorを解決するにはどうすればよいですか?
フィードパーサーを使用してRSSフィードを読み取ろうとしています。
英語のRSSフィードでは正常に機能しますが、キリル文字で書かれたタイトルを表示しようとすると、UnicodeEncodeErrorが発生します。それは私が:
- ファイルにタイトルを書いてみてください。
- 画面にタイトルを表示してみてください。
- WebページにアクセスするためにURLでそれを使用してみてください。
私の質問は、この問題を簡単に解決する方法です。私はこれと同じくらい簡単な解決策を持ちたいです:
すべてのキリル文字をそのHTMLコードで置き換える方法はありますか?
database - VARCHAR2を使用して非Unicode OracleデータベースにUnicode列を保存するにはどうすればよいですか?
非Unicode文字セットで構成されたOracleデータベースにUnicode文字を保存するにはどうすればよいですか(この構成は変更できません)。
テキストは VARCHAR2 列に保存されます (NVARCHAR2 にすることはできません)。