問題タブ [utf-32]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
323 参照

vba - Word マクロでの UTF32 シンボルの印刷

私はWord用のVBAをいじっています.Word文書でバッチ検索/置換を行うプロジェクトに取り組んでいます。検索/置換用語のリストを .csv からインポートしました。

私が直面している問題は、単語を単語を表す記号に置き換えたいということです。たとえば、パンという単語を使用している場合、パンを表す UTF-32 記号 (Unicode 10 進数 127838/16 進数 0x1f35e) に置き換えます。組み込みの MS-Word の検索/置換を使用して手動でこれを行っていたとき、これはうまく機能しました。置換ボックスに alt+127838 と入力するだけで問題なく動作しましたが、UTF-32 の検索/置換を実行しましたバッチが問題を引き起こしているようです。

ChrW() を使用すると、ChrW は 65,535 までの値しか受け入れないため、範囲外になります。17 番目のビットを処理できません。プラグインしようとすると、実行時エラーが発生します。

\U エスケープ文字を使用してみましたが、文字通り "\U127838" に置き換えられただけで、あまり役に立ちません。VBA が Unicode エスケープ文字をサポートしているかどうかは不明です。引用符で囲まないと、構文エラーが発生します。

私はプログラミングは初めてではありませんが、VBA と VB は初めてです。オンラインで調べたところ、VB の UTF32Encoding クラスが VBA で動作しないようです

https://msdn.microsoft.com/en-us/library/system.text.utf32encoding(v=vs.90).aspx

VB と VBA のニュアンスに慣れていない可能性がありますが、イニシャライザを試してみると、次のようになりました。

Dim u32LE As New UTF32Encoding(False, True)

VBA コードで構文エラーが発生しました。

Imports ステートメントを使用してみましたが、コンパイラも混乱しました。何か間違っているのか、それとも VBA がこのクラスをサポートしていないのかはわかりません。

VBA が UTF32 文字の出力をサポートしていない場合はお知らせください。代わりに Python や Java などを使用してみてください。あなたの助けは大歓迎です!

ここに私が書いている関数を見てください。エラーが発生したため、インポート行をコメントアウトしました(「.Text」を強調表示しているメソッドまたはメンバーが見つかりませんでした)

サブ終了

0 投票する
1 に答える
540 参照

unicode - UTF-16 が送信するバイト数を知る方法

こんにちは、スタック オーバーフロー コミュニティです。

UTF-16 は、2 バイトの文字セットまたは 4 バイトの文字セットです。

私が理解しているように、4 バイト文字セットは、high(16) と low(16) のサロゲートで構成されています。

UTF-8 は、1 バイト、2 バイト、3 バイト、4 バイト、または最大 7 バイトのいずれかです。

しかし、最初のオクテットのビットを見れば、UTF-8 からのバイト数を簡単に知ることができます。

UTF-16 と UTF-32 からのバイト サイズをどのように特定するのだろうか。

Unicode に関する皆様のご支援とご意見をお待ちしております。

ありがとう。

ドンソプ

0 投票する
1 に答える
906 参照

java - Javaでコンパイル時に文字列のエンコーディングを変更する方法はありますか?

だから私はこの簡単なコードを持っています:

そして、それをコンパイルして実行しましょう:

プログラムの実行時に Java に UTF-32 エンコーディングを使用するように指示したため、1 つの文字が String で 4 byes かかることに驚きはありません。

UTF-8エンコーディングでプログラムを実行してみましょう:

すべて問題ないようです。

現在、クラス ファイル (FooBar.class) は451 バイトです。次のようにコードを変更します。

もう一度コンパイルして、ディスク内のファイルの長さが453 バイトであることを確認します。

明らかに、ファイル自体は UTF-8 エンコーディングでディスクに保存されます。この .class ファイルを UTF-32 エンコーディングで実行すると、次のようになります。

すべて問題ないようですが、文字列文字に UTF-32 を使用して .class ファイルをエンコードするようにコンパイラに指示する方法はありますか?

0 投票する
0 に答える
193 参照

unicode - UTF-16/32 unicode NSString を UTF16/32Char に変換します

UTF-16 および UTF-32 Unicode 値を格納する文字列があります。

これらの文字列を 16 進数値の UTF16Char および UTF32Char に変換して、次と同じ結果を得たいと考えています。

よろしくお願いいたします。

0 投票する
0 に答える
41 参照

c# - Document.Range を使用して VSTO で "" を読み取る場合、テキストは "" として読み取られます。これは UTF-32 であり、C# は文字列に UTF-16 を使用します。テキストを "" として読み取る方法

0 投票する
2 に答える
903 参照

c++ - 端末でユニコード文字列の幅を検出するには?

ユニコードをサポートする端末ベースのプログラムに取り組んでいます。文字列を印刷する前に、文字列が消費する端末列の数を決定する必要がある場合があります。残念ながら、一部の文字は 2 列幅 (中国語など) ですが、ICU ライブラリから u_getIntPropertyValue() を呼び出すことで、全角文字を検出する良い方法を示すこの回答が見つかりました。

今、UTF8 文字列の文字を解析して、この関数に渡そうとしています。私が今抱えている問題は、u_getIntPropertyValue() が UTF-32 コード ポイントを想定していることです。

これをutf8文字列から取得する最良の方法は何ですか? 現在、boost::locale (プログラムの他の場所で使用) を使用してこれを実行しようとしていますが、クリーンな変換を行うのに問題があります。boost::locale からの UTF32 文字列は、バイト順を示すために幅ゼロの文字が先頭に追加されます。明らかに、文字列の最初の 4 バイトをスキップできますが、これを行うよりクリーンな方法はありますか?

これが私の現在の醜い解決策です:

0 投票する
0 に答える
230 参照

c# - c# datatable データ型を UTF32 に

やりがいのある問題があります。現在、タイプがUTF32でない限り、データテーブルがサポートしないEM-DASHおよびその他の特殊文字を含むSQLからデータテーブルを取得しています。データ型を文字列から UTF32 に変換する方法はありますか?

クエリを読み取り、すべての列が文字列形式であることに注意してください。これは私がこれまでに行ったことです:

ただし、これは機能しません。これを行う方法はありますか? そうしないと、em-dash は UTF8 を使用しているため、隠し記号になります。