問題タブ [shift-jis]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1263 参照

python - エンコーディングが shift_jis にある場合、Python の電子メール モジュールを使用して電子メールを解析する際にエラーが発生する

電子メール パーサーを使用して shift_jis でエンコードされた電子メールをデコードして Unicode に変換しようとすると、「UnicodeDecodeError: 'shift_jis' コーデックは位置 2-3 のバイトをデコードできません: 不正なマルチバイト シーケンス」というエラーが表示されます。コードと電子メールは以下にあります。

電子メール: http://pastebin.com/L4jAkm5R

これは、Unicode と shift_jis のエンコード方法の違いに関連している可能性があるという別のスタック オーバーフローの質問を読みました (このマイクロソフト サポート技術情報の記事を参照しました)。私のコードの何が原因で動作しないのか誰かが知っている場合、またはこれが合理的に修正可能である場合でも、その方法を見つけていただければ幸いです。

0 投票する
2 に答える
2311 参照

perl - perlでのシフトJISデコード/エンコード

shift-jis でエンコードされた文字列をデコードして再度エンコードしようとすると、一部の文字が文字化けします: 次のコードがあります:

入力で文字列 : hellosoworld を使用すると、適切にデコードされてエンコードされます。つまり、デコード前とエンコード後に上記のコードで同じ値が出力されます。しかし、次のような別の文字列を試したとき:ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩ

最終出力が文字化けしました。

それは perl ライブラリ固有の問題ですか、それとも一般的なシフト jis マッピングの問題ですか? それに対する解決策はありますか?

0 投票する
3 に答える
722 参照

python - Pyparsing - 混合jascii/asciiテキストファイルからjasciiテキストを解析しますか?

jascii/shift-jis と ASCII テキストが混在するテキスト ファイルがあります。私は使用pyparsingしていますが、そのような文字列をトークン化できません。

コード例を次に示します。

私は得る:

これは、テキスト ファイルの内容です。

(引用符なし)

0 投票する
1 に答える
1171 参照

java - Java でシフト JIS 文字に XOR を使用する

だから私は小さな復号化プログラムを書こうとしていますが、少し問題が発生しています。「FF」(すべてのビットを反転) を使用して文字に XOR を適用しています。これは、文字列をバイト配列に変換してから XOR を適用することによって実行しています。しかし、文字は Shift-JIS エンコーディングで、何かが機能していません。通常の文字でこの方法を試してみるとうまくいくようですが、日本語の文字になると何かがうまくいきません。

しかし、日本語の文字に固執すると、すべての文字が「yyyyyy」に変換されます。問題を確認するためにバイト配列を出力してみましたが、各文字が「63」として格納されていることがわかりました。文字を正しく保存するにはどうすればよいですか? 実際、Shift-JIS 文字で XOR を使用するにはどうすればよいでしょうか。

基本的にビットを 0010 から 1101 に反転してから文字に戻したいので、XOR を使用しています。それは可能ですか?

ありがとう

たとえば、これは私の入力でした: '始めまして" そして、出力されるのは: "yyyyy" そして、"こんにちは" のようなことをすると、".#**)f2.#4#" が得られます。

0 投票する
2 に答える
15119 参照

python - shift-jis のデコード: 「不正なマルチバイト シーケンス」

次のように、shift-jis でエンコードされた文字列をデコードしようとしています。

私のプログラムでそれを表示できるようにします。

16 進数の "0x87 0x54" と "0x87 0x55" の 2 つの shift-jis 文字に遭遇すると、次のエラーが発生します。

しかし、それらは有効なシフト jis 文字であると確信しています: http://www.rikai.com/library/kanjitables/kanji_codes.sjis.shtml

また、shift-jis テキスト エディタではこれらの文字が黒いボックスとして表示されることにも気付きました。これは、認識されていないことを意味します。この 2 つの文字には、私のエディタと Python デコーダが機能しなくなる特別な理由があります。ヘルプ?

(申し訳ありませんが、これらの文字が存在する場合、それ以降はクリップボードに追加されず、自動的にユニコードに変換されるため、サンプル文字列を投稿できませんでした。ただし、それらの16進値を投稿しました。)

0 投票する
1 に答える
1555 参照

python - PythonでShift_JIS文字コードをUnicode文字に変換するにはどうすればよいですか?

Unicode文字に変換したいShift_JIS文字コード(整数)のリストがあります。chr()/unichr()他のエンコーディングで動作するバージョンの関数が必要だと思います。decode()と組み合わせて試しましhex()たが、16進値ではなく、文字列自体のみをデコードします。

入力と出力の例:

誰か助けてもらえますか?前もって感謝します。

0 投票する
1 に答える
840 参照

smarty - Smarty-PHPを使用しないShift-jisエンコーディング

Shift-jis文字を表示したいのですが、表示する場合のみです。UTF-8に保存し、Shift-jisで表示します。それでは、Smartyでそれを行うためのソリューションは何ですか?

0 投票する
3 に答える
4402 参照

python - shift-jis文字コードを指定してutf-8文字コードを取得しますか?

私のプログラムでは、shift-jis文字コードをPython整数として取得し、対応するutf8文字コード(これも整数である必要があります)に変換する必要があります。どうやってやるの?ASCIIの場合、整数をASCII文字列に変換できる便利な関数ord()/ chr()があり、後でユニコードに簡単に変換できます。他のエンコーディングではそのようなものは見つかりません。

Python2を使用します。

編集:最終的なコード。みんな、ありがとう:

0 投票する
2 に答える
7512 参照

javascript - Javascriptで日本語の文字の長さを取得するには?

SHIFT_JIS 文字セットを使用した ASP Classic ページがあります。ページの head セクションの下にあるメタ タグは次のようになります。

私のページには、200 文字までしか入力できないテキスト ボックス (txtName) があります。[送信] ボタンの onclick() イベントで呼び出される、文字の長さを検証する Javascript 関数があります。

問題は、Javascript が SHIFT_JIS でエンコードされた日本語文字の正しい長さを取得していないことです。たとえば、文字「测」の SHIFT_JIS の長さは 8 文字ですが、おそらく Javascript がデフォルトで使用する Unicode エンコーディングが原因で、Javascript はそれを 1 文字としてしか認識しません。ケなどの一部の文字は、SHIFT_JIS では 2 文字または 3 文字です。

Javascript によって提供される長さのみに依存する場合、長い日本語の文字はページ検証に合格し、データベースに保存しようとしますが、DB 列の最大長が 200 であるため失敗します。

私が使用しているブラウザは Internet Explorer です。Javascriptを使用して日本語文字のSHIFT_JISの長さを取得する方法はありますか? Javascript を使用して Unicode から SHIFT_JIS に変換することは可能ですか? どのように?

助けてくれてありがとう!

0 投票する
1 に答える
969 参照

android - AndroidとソケットでのUTF-8とSJISの問題

私はAndroidとPCの両方で、ソケットを使用して相互に通信するチャットアプリに取り組んでいます。問題は、アプリが日本語で動作する必要があるのに、Android側で文字コードの問題が発生することです。

サーバーはPC上で動作し、すべてのクライアントがPC上にある場合はすべて正常に動作するため、Android側ですべてのエンコード/デコードを実行しようとしました。両方のクライアントで、System.getProperty( "file.encoding");を試しました。

PCはShift_JISを使用し、AndroidはUTF-8を使用していることがわかりました。だから私はしました

しかし、それでも文字コードの問題が発生しました。

「Shift_JIS」と「UTF-8」を入れ替えてみましたが、うまくいきませんでした…何かアドバイスがあれば嬉しいです。ありがとうございました!