問題タブ [unicode-string]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
905 参照

objective-c - Objective-C:Unicode文字を文字列にデコードするにはどうすればよいですか?

NSUTF32BigEndianStringEncoding次のように文字列をエンコードします。

たとえば、これにより<00000041>、文字列のユニコードが得られますAAでは、どうすればユニコードから文字列を取り戻すことができますか<00000041>。どうもありがとうございます。

0 投票する
3 に答える
9846 参照

c++ - Unicode 文字列をファイルに書き込む

ファイルの読み取りと書き込みを行うクラスを作成しようとしています。文字列の場合、ANSI と Unicode の 2 つの方法があります。ANSI 関数は問題ありませんが、私の Unicode 関数には問題があります。

「0xFEFF」のものをチェックしたりスキップしたりせずに、Unicodeファイルを直接、つまり直接読み取ることができるのは少し配線されています。どの言語を使用していても機能します (英語、中国語、日本語を試しました)。私が知っておくべきことはありますか?

次に、最大の問題が飛び出しました: Unicode 文字列をファイルに書き込むことです。最初に、「\n」文字を使用せずにアルファベットとして簡単な英語を試しましたが、うまくいきました。次に、「\ n」を押し込むと、問題が発生し始めます。出力は、「abcdefg \nhijklmn \nopqrst \nuvwxyz」(「\ n」は機能しますが、スペースが非常に多い)のように多くのスペースで挿入され、ファイルは再び ANSI になります。他の言語の文字を聞かないでください。まったく読めません。

ここで質問があります: Unicode 文字列をファイルに正しく書き込むにはどうすればよいですか? 「_wopen」関数については言及しないでください。ファイルは既に「fopen」関数で開かれています。

回答とアドバイスをいただければ幸いです。

Windows 7 とビジュアル スタジオを使用しています。

編集:次のコードで英語以外の文字に対して機能しますが、「\ n」ではまだ間違っています。

しかし、それはどのように機能しますか?ファイルを読んでいる間、私はそれを見なかったということです。

編集:私のコードの一部。

出力ファイルの内容は次のとおりです。

「L'\n'」の正しい表現かどうかはわかりませんが、Unicode を扱ったことがありません。私を助けてくれてありがとう :)

0 投票する
1 に答える
1031 参照

ruby-on-rails - Rails 2.3 および Ruby 1.9 での無効なバイト シーケンス utf-8 エラー

アプリを Rails 2.3.8 / Ruby 1.8.7 から 2.3.14 / Ruby 1.9.2 に移行しました - 簡単ではありませんが、基本的には機能します。私が常に抱えている問題は、時折 Haml テンプレートで次のエラーが発生することです。

これはエンコーディングの問題であり、( を使用して) 対処する方法についていくつかの提案を見てきましIconv.convたが、私が試したことはうまくいかなかったようです。アプリケーション レベルでこれを解決するにはどうすればよいですか (すべてのテンプレートにパッチを適用する必要はありません)。ありがとう。

編集:いくつかのスタック トレース

データベース テーブルCHARSETは でエンコードされUTF-8ます。テンプレートに特定のエンコーディングを割り当てませんでしたが、設定しました

environment.rb

0 投票する
4 に答える
4804 参照

perl - Perl: Unicode 文字列を Windows コンソールに出力する

Unicode 文字列を Windows コンソールに出力する際に​​奇妙な問題が発生しています*。

次のテキストを検討してください。

「file.txt」というファイルにあるとします。

*: "type file.txt" にすると、問題なく出力されます。しかし、Perl プログラムから出力すると、次のようになります。

Unicode 行 (この場合はヘブライ語) が、次のように部分的に壊れて毎回表示されます。

(すべてを UTF-8 で保存します)。

これは非常に奇妙です。助言がありますか?

(これは「Console2」の問題ではありません* - 「通常の」Windows コンソールでも同じ問題が発生しますが、ヘブライ語のグリフが表示されないだけです)。


* 「Console」(「Console2」とも呼ばれる) の使用 - これは、Windows コンソールで Unicode を操作できる便利な小さなユーティリティです

** 注: コンソールでは、もちろん次のように言う必要があります。

0 投票する
2 に答える
2345 参照

visual-c++ - MASM のワイド文字列リテラル?

あなたが使う

namebyte-string であると宣言します"Foo"

代わりに単語文字列であることをどのように宣言しますか? (つまり、1 文字あたり 16 ビット)

編集:

マクロ内でうまく機能する方法を探しています。たとえば、次のようになります。

0 投票する
1 に答える
1962 参照

python - コマンドライン引数として Unicode 文字列 (日本語の文字) を渡す

Python 2.7 の使用を知っている人がいるかどうかを尋ねます。どうすれば Unicode 文字列 (たとえば、日本語のファイル名) を Python スクリプトのコマンドライン引数として渡すことができますか。このファイル名が関数/メソッドに正しく渡されると、一部のファイル処理 (メタデータの抽出/取得など) が何らかのエンジン (Unicode をサポートすることが確認されている DLL) によって実行されます。次のことを試しましたが、残念ながら、python がクラッシュします。

ファイルを処理するメソッドにファイル名を渡す:

メソッドで、渡された文字列をデコードする方法は次のとおりです。

フィードバックは非常に役立ちます。どうもありがとう!

0 投票する
5 に答える
23003 参照

python - Python2.7でのbase64エンコーディングUnicode文字列

requestsモジュールを使用してWebサービスから取得したUnicode文字列があります。この文字列には、バイナリドキュメント(PCL)のバイトが含まれています。これらのバイトの1つは値248であり、base64エンコードしようとすると、次のエラーが発生します。

248は符号なしバイトの範囲内にあるため(そしてバイト文字列に保持できるため)、これは少し驚くべきことですが、私の本当の質問は、この文字列をエンコードするための最良または正しい方法は何ですか?

私の現在の回避策はこれです:

これは正しくbyte_string機能しているようで、結果はbase64でエンコードできますが、もっと良い方法があるはずです。ある?

0 投票する
1 に答える
4843 参照

c - 文字列に別のCが含まれているかどうかを確認します

今私はこのコードを持っていますが、それは常にnullに設定されています

私の場合のstrstrが常にnullである理由を説明できますか?

0 投票する
1 に答える
312 参照

javascript - 文字の範囲を取得する方法

私はSVGをインポートしようとしています-Javascriptを使用したフォントで、1文字でもアニメーション化できるようにします。これにより、グリフのUnicode値がキーを定義し、グリフ自体が値になるJavascriptオブジェクトにグリフを保存しています。したがって、特定の文字列からテキストを作成するときは、文字列の各文字を使用して、それに適したグリフを取得します。そして、ここに私の質問があります:

glyphs unicode 属性の unicode-value (ここで指定unicode="&#x66;&#x66;&#x6c;") は、16 進数 ( ) または 10 進数 ( ") 表記の XML 文字参照にすることができますunicode="&#102;&#102;&#108;。hkern- 要素と vkern-要素 (カーニング テーブルを表す) の場合、Unicode 範囲として指定された文字(指定 ここおよびここ).これらすべての可能なバリエーションから変換できるライブラリはありますか?この問題の解決に役立つ詳細情報を見つけることができるリソースを知っている人はいますか?

全体的な問題は、入力のすべての可能なバリエーションを、グリフ マップのキーとして使用できる一貫性のある Unicode 値のリストに変換することです。

0 投票する
2 に答える
934 参照

c++builder - UnicodeString 型の LeftStr()

一部の C++Builder コードを BCB2010 に移行しています。これらのオーバーロードがないため、これらの呼び出しを適切な関数に置き換える必要がLeftStr()ありRightStr()ますUnicodeString

AnsiLeftStr()機能しているように見えますが、名前が怖いです...