問題タブ [ucs2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - Unicode テキストブロックを UTF-8 (HEX) コードポイントに変換する方法は?
次のような Unicode テキストブロックがあります。
ここで、この元の Unicode テキスト ブロックを UTF-8 (HEX) コード ポイントのテキスト ブロックに変換したいと思います (このページの16 進 UTF-8列を参照してください: https://en.wikipedia.org/wiki /UTF-8 )、by PHP
; このような:
このようではありません:
PHPでそれを行う方法はありますか?
このトピック ( PHP: Convert unicode codepoint to UTF-8 ) を読みました。しかし、それは私の質問に似ていません。
申し訳ありませんが、私はあまり知りませんUnicode
。
javascript - nodejsでUTF16ファイルをUTF8ファイルに変換する方法
UTF16 でエンコードされた xml ファイルがあり、それを処理するために UTF8 に変換したいと考えています。このコマンドを使用する場合:
ファイルは正しく変換され、処理できます。nodejsでも同じことをしたいです。
現在、私は自分のファイルのバッファを持っており、考えられるすべてのことと、インターネットで見つけることができるものをすべて試しましたが、うまくいきませんでした。
これまでに試したことの例をいくつか示します。
私もこれらの機能を使ってみました:
http://jonisalonen.com/2012/from-utf-16-to-utf-8-in-javascript/ https://stackoverflow.com/a/14601808/1405208
最初のものは何も変更せず、リンクは漢字のみを提供します。
python - '\uFFFF' より上のすべての Unicode 文字に一致する正規表現
UCS-4 文字を取得すると、Pygame と Pyglet の両方がクラッシュします。
exceptions.UnicodeError: '\uFFFF' より上の Unicode 文字が見つかりました。サポートされていません
これらすべての文字を正規表現でフィルタリングするにはどうすればよいですか?
php - PHP は文字列を UCS-2LE から UTF-8 に変換します
私は現在、言語情報を含むファイルを順次 (256 バイト) 読み取る必要があるプロジェクトに取り組んでいます。したがって、文字列オフセット 0 は言語コード 1 の値を開始し、オフセット 256 は言語コード 2 の値を開始します...
ただし、ファイルのエンコーディングは正確にはわかりません。著者は、ファイルが Unicode でエンコードされていると述べています。これは、BOM なしの UCS2 LE として識別される Notepad++ で開くことによって確認されます。
次のように、テキストを 255 バイト長のチャンクに分割する前に、テキストを変換しようとしています。
これは " Пользователь заблокирован
" のような値を生成します。私はこのファイルがロシア語であることを知っているので、有望に見えます。ただし、正しくないように見える値がまだあります。
このコードで変換すると、同じ結果が得られます。
さまざまなソースから取得したさまざまなエンコーディングを次に示します。
そして、ここにファイルの一部があります( で抽出vi
され、わかりやすくするために改行が追加されています):
このファイルを読み取って、PHP で正しいエンコーディングに変換するにはどうすればよいですか? そして、今はどのエンコーディングですか?前もって感謝します!