問題タブ [ucs2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - UCS-2 リトル エンディアン、Java でテキスト ファイルを書き込む
.txt ファイルを書き込もうとしていますが、UCS-2 リトル エンディアンでなければなりませんが、
私が読んだことから、それは同じはずですが、サーバー上の特定のアプリケーションでは機能しません。Notepad ++で(手動で作成された)動作するファイルを開くと、「UCS-2 Little Endian」と表示されますが、このようにJavaで作成すると「UCS-2 LE w/o BO」と表示され、サーバーはそれを読み取ることができません。
それが機能するようにどのように書くことができますか?これはコード全体です:
提案をありがとう。
mysql - mysql は e と è を分離しません
ucs2_slovenian_ci を使用する mysql データベースには 2 つのテーブルがあります (これは変更できません)。「e」と「è」の違いを認識し、それらの行を異なる値に接続しないSQLを作成するにはどうすればよいですか?
うまくいきません。ご協力ありがとうございます
git - Git で UCS-2 ファイルを UTF-8 にさかのぼって変換する
Windows で使用される 16 ビット Unicode (UCS-2) でエンコードされている、Git リポジトリに複数のコミットがあるファイルがあります。
そのため、Git はそれをテキスト ファイルではなくバイナリ ファイルと見なし、別のコミットによる変更を確認できません。
そのファイルをさかのぼって UTF-8 に変換する方法はありますか。つまり、ファイルが常に UTF-8 であったかのように履歴を再構築し、16 ビット Unicode ではなく UTF-8 ファイルとして常にコミットしていました。ファイル?
unicode - UCS-2 は、UTF-8 で 6 バイトを使用する Unicode コード ポイントをどのように表示しますか?
http://www.joelonsoftware.com/articles/Unicode.htmlでユニコードについて読んでいました。Joel 氏によると、UCS-2 はすべての Unicode 文字を 2 バイトでエンコードしますが、UTF-8 は一部の Unicode 文字をエンコードするのに最大 6 バイトかかる場合があります。UTF-8 でエンコードされた 6 バイトの Unicode 文字が UCS-2 でどのようにエンコードされるか、例を挙げて説明していただけますか?
android - UCS-2 は Android 用のクラス 0 SMS を有効にしました
UCS-2 エンコーディングをいじらずにクラス 0 の SMS を送信する方法を探しています。
Androidのスレッドクラス 0 SMS (フラッシュ SMS)の回答は、通常のテキストは適切に送受信されるため、UCS-2 エンコーディングをいじっているように見えますが、UCS-2 エンコーディングを必要とする言語はジャンク文字として表示されます。
IE
送信時、
どちらの場合も、 受信されます。
両方、[スレッドの 2 番目の回答、stackoverflow.com/a/9424185/3082310]
そして、[ZeroSMS、github.com/virtualabs/ZeroSMS]
同じ結果が得られるようです。
問題がどこにあるのかについてのアイデアはありますか?
c++ - icu ライブラリを使用した UTF-8 から UCS-2 への変換
私は現在、icu ライブラリを使用して UTF-8 文字列を UCS-2 文字列に変換する際に問題に取り組んでいます。ライブラリでこれを行う方法はいくつかありますが、これまでのところどれも機能していないようですが、このライブラリの人気を考えると、私は何か間違ったことをしていると思います.
まずは共通コードです。すべての場合において、オブジェクトに文字列を作成して渡しますが、変換ステップに到達するまで操作はありません。
現在使用されている utf-8 文字列は単に "ĩ" です。
簡単にするためにuniString
、このコードのように使用されている文字列を表します
問題は、ucnv_fromAlgorithmic
関数がU_INVALID_CHAR_FOUND
ucs-2 変換でエラーをスローしていることです。これはISO-8859-1
試みには意味がありますが、ucs-2 には意味がありません。
もう1つの試みは、ucnv_convert
コメントアウトされているのを使用することでした。この関数は変換を試みましたが、失敗しませんでしたISO-8859-1
。
問題は、これらの関数を使用した経験があり、何か間違っていることを見た人はいますか、またはこの文字の変換の仮定について何か間違っていることがありますか?
php - 中国語の単語を配列にロードする
次のように、カンマで区切られた複数行の中国語の単語を含むファイルがあります,
。
次のコードを使用してそれらを配列にロードしたいと考えています。これにより、後でこの配列を使用して、記事に含まれる中国語の単語を検索できるようになります。
私の質問:
$_SP_ = chr(0xFF).chr(0xFE) mean?chr(0xFF).chr(0xFE)
ASCII の最後の 2 文字から取得した文字列とは何ですか?SPを ucs-2b から utf-8 形式に変換する必要があるのはなぜですか?
再び文字列に変換されますが、utf-8 型で
$ws
区切られているのはなぜですか。chr(0xFF).chr(0xFE)
なぜすべての単語の長さが必要なのですか?
なぜ
$spstr
UCS-2beタイプなのか? の組み合わせだからchr(0xFF).chr(0xFE)
?
java - UCS-2 の java.io.UnsupportedEncodingException
ハンガリー語のテキストがあり、UCS2 エンコーディングでエンコードしたい
しかし、次の例外が発生しています
何が間違っている可能性がありますか?
編集
次のコマンドを使用してjarファイルを実行します実際に私のコマンドは次のようなものです
java -Dfile.encoding=UCS-2 -cp MyApp.jar com.sms.Main "9876543210" “UCS-2” > testApp.log
また、使用すべき正しいエンコーディングは何か、UTF-8を使用しましたが、出力が正しくありません。
c# - USSD 受信メッセージのデコード
AT+CUSD コマンドをモデムに送信していますが、このメッセージを受信しても、理解もデコードもできません。助けが必要です。これはサンプルです
最初は読み取り可能で、dcs は 15 ですが、もう 1 つは読み取り可能ではなく、dcs は 72 です。