問題タブ [ucs2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
9586 参照

java - UCS-2 リトル エンディアン、Java でテキスト ファイルを書き込む

.txt ファイルを書き込もうとしていますが、UCS-2 リトル エンディアンでなければなりませんが、

私が読んだことから、それは同じはずですが、サーバー上の特定のアプリケーションでは機能しません。Notepad ++で(手動で作成された)動作するファイルを開くと、「UCS-2 Little Endian」と表示されますが、このようにJavaで作成すると「UCS-2 LE w/o BO」と表示され、サーバーはそれを読み取ることができません。

それが機能するようにどのように書くことができますか?これはコード全体です:

提案をありがとう。

0 投票する
1 に答える
30 参照

mysql - mysql は e と è を分離しません

ucs2_slovenian_ci を使用する mysql データベースには 2 つのテーブルがあります (これは変更できません)。「e」と「è」の違いを認識し、それらの行を異なる値に接続しないSQLを作成するにはどうすればよいですか?

うまくいきません。ご協力ありがとうございます

0 投票する
1 に答える
1713 参照

git - Git で UCS-2 ファイルを UTF-8 にさかのぼって変換する

Windows で使用される 16 ビット Unicode (UCS-2) でエンコードされている、Git リポジトリに複数のコミットがあるファイルがあります。

そのため、Git はそれをテキスト ファイルではなくバイナリ ファイルと見なし、別のコミットによる変更を確認できません。

そのファイルをさかのぼって UTF-8 に変換する方法はありますか。つまり、ファイルが常に UTF-8 であったかのように履歴を再構築し、16 ビット Unicode ではなく UTF-8 ファイルとして常にコミットしていました。ファイル?

0 投票する
2 に答える
1442 参照

unicode - UCS-2 は、UTF-8 で 6 バイトを使用する Unicode コード ポイントをどのように表示しますか?

http://www.joelonsoftware.com/articles/Unicode.htmlでユニコードについて読んでいました。Joel 氏によると、UCS-2 はすべての Unicode 文字を 2 バイトでエンコードしますが、UTF-8 は一部の Unicode 文字をエンコードするのに最大 6 バイトかかる場合があります。UTF-8 でエンコードされた 6 バイトの Unicode 文字が UCS-2 でどのようにエンコードされるか、例を挙げて説明していただけますか?

0 投票する
1 に答える
993 参照

android - UCS-2 は Android 用のクラス 0 SMS を有効にしました

UCS-2 エンコーディングをいじらずにクラス 0 の SMS を送信する方法を探しています。

Androidのスレッドクラス 0 SMS (フラッシュ SMS)の回答は、通常のテキストは適切に送受信されるため、UCS-2 エンコーディングをいじっているように見えますが、UCS-2 エンコーディングを必要とする言語はジャンク文字として表示されます。

IE

送信時、http://i.stack.imgur.com/xTX8m.png

どちらの場合も、http://i.stack.imgur.com/UcYxS.png 受信されます。

両方、[スレッドの 2 番目の回答、stackoverflow.com/a/9424185/3082310]

そして、[ZeroSMS、github.com/virtualabs/ZeroSMS]

同じ結果が得られるようです。

問題がどこにあるのかについてのアイデアはありますか?

0 投票する
1 に答える
1113 参照

c++ - icu ライブラリを使用した UTF-8 から UCS-2 への変換

私は現在、icu ライブラリを使用して UTF-8 文字列を UCS-2 文字列に変換する際に問題に取り組んでいます。ライブラリでこれを行う方法はいくつかありますが、これまでのところどれも機能していないようですが、このライブラリの人気を考えると、私は何か間違ったことをしていると思います.

まずは共通コードです。すべての場合において、オブジェクトに文字列を作成して渡しますが、変換ステップに到達するまで操作はありません。

現在使用されている utf-8 文字列は単に "ĩ" です。

簡単にするためにuniString、このコードのように使用されている文字列を表します

問題は、ucnv_fromAlgorithmic関数がU_INVALID_CHAR_FOUNDucs-2 変換でエラーをスローしていることです。これはISO-8859-1試みには意味がありますが、ucs-2 には意味がありません。

もう1つの試みは、ucnv_convertコメントアウトされているのを使用することでした。この関数は変換を試みましたが、失敗しませんでしたISO-8859-1

問題は、これらの関数を使用した経験があり、何か間違っていることを見た人はいますか、またはこの文字の変換の仮定について何か間違っていることがありますか?

0 投票する
0 に答える
92 参照

php - 中国語の単語を配列にロードする

次のように、カンマで区切られた複数行の中国語の単語を含むファイルがあります,

次のコードを使用してそれらを配列にロードしたいと考えています。これにより、後でこの配列を使用して、記事に含まれる中国語の単語を検索できるようになります。

私の質問:

  1. $_SP_ = chr(0xFF).chr(0xFE) mean?chr(0xFF).chr(0xFE)ASCII の最後の 2 文字から取得した文字列とは何ですか?

  2. SPを ucs-2b から utf-8 形式に変換する必要があるのはなぜですか?

  3. 再び文字列に変換されますが、utf-8 型で$ws区切られているのはなぜですか。chr(0xFF).chr(0xFE)

  4. なぜすべての単語の長さが必要なのですか?

  5. なぜ$spstrUCS-2beタイプなのか? の組み合わせだからchr(0xFF).chr(0xFE)?

0 投票する
1 に答える
5247 参照

java - UCS-2 の java.io.UnsupportedEncodingException

ハンガリー語のテキストがあり、UCS2 エンコーディングでエンコードしたい

しかし、次の例外が発生しています

何が間違っている可能性がありますか?

編集

次のコマンドを使用してjarファイルを実行します実際に私のコマンドは次のようなものです

java -Dfile.encoding=UCS-2 -cp MyApp.jar com.sms.Main "9876543210" “UCS-2” > testApp.log

また、使用すべき正しいエンコーディングは何か、UTF-8を使用しましたが、出力が正しくありません。

0 投票する
1 に答える
2047 参照

c# - USSD 受信メッセージのデコード

AT+CUSD コマンドをモデムに送信していますが、このメッセージを受信して​​も、理解もデコードもできません。助けが必要です。これはサンプルです

最初は読み取り可能で、dcs は 15 ですが、もう 1 つは読み取り可能ではなく、dcs は 72 です。