問題タブ [utf8-decode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
171 参照

utf8-decode - Web サイトの UTF-8 エンコーディングの問題

私は自分のサイトのエンコーディングで立ち往生しています.utf-8にサイトを正しくエンコードしていませんでしたが、私がどこで間違っていたのか分かりません. たとえば、このリンク: www.mkmeme.com/meme/eoj37h

ソースを表示すると、タグコードは次のとおりです。

正しいコードが必要です

誰かがこれで私を助けてくれることを願っています

0 投票する
1 に答える
1075 参照

objective-c - スカンジナビアの文字æ、ø、åが正しくエスケープされていません

私のプログラムは他の国のサーバーとインターフェイスし、外国文字を含むURLを定期的に処理する必要があります。æこれは、、、、などのスカンジナビア文字を検討するまでは問題なく機能øåます。URLを受け取ったら、次のようにデコードします。

ただし、これではこれらの文字を正しくデコードできません。

編集:これはエンコード機能です:

0 投票する
1 に答える
1100 参照

java - サーバーjava.nioでCharsetUTF-8でエンコードされたバッファーを読み取る方法

サーバーで私のメッセージはエンコードされています

チャネルに書き込みますが、サーバーでデータを読み取れません。

サーバーでこのエンコードされたデータを読み取る方法を知っている人はいますか?

0 投票する
1 に答える
1436 参照

utf-8 - 非ASCII文字のファイル名でファイルをダウンロードするJSch

JSch の ChannelSftp を使用して、リモート FTP サーバーからローカル Linux マシンにファイルをダウンロードしています。リモート マシンに非 ASCII 文字を含むファイル名のファイルがある場合、ダウンロードされたファイルには ? それらの非ASCII文字の代わりに。

たとえば、ftp サーバーにあるファイル名が test-測試中國人的字.txt のファイルは、ローカル マシンにダウンロードすると test-??????.txt として表示されます。

ダウンロード後に非ASCII文字を保持するか、より意味のあるものに自動的に変換する方法はありますか.

0 投票する
1 に答える
148 参照

.net - バイト順マーク検出によるバイト配列のテキストへの変換

これに相当するバイト[]を見つけようとしています

StreamReader で利用できるように、指定されたバイト オーダー マーク検出オプションを使用して byte[] を文字列に変換したいと考えています。

0 投票する
1 に答える
1392 参照

php - PHP の utf8_encode および utf8_decode 関数に相当する Ruby

重複の可能性:
Ruby で文字列を windows-1252 から utf-8 に変換するにはどうすればよいですか?
utf8 文字を iso8859-1 に変換するにはどうすればよいですか

ここに私の問題があります。内部 LAN に配布したツールがあり、外部 Web サーバーがジョブ/データを内部 LAN に提供しています。その結果、スヌーピーの人には見られたくないデータを渡すことがよくあります。言い換えれば、誰かが私の SQL 文字列を見たとしても世界の終わりではありませんが、見られたくないのです。ガラスの引き戸のデッドボルトのようなものです。それは誰もが本当に決心するのを止めることはありませんが、ランダムな好奇心旺盛なスクリプトキディーを思いとどまらせるはずです.

だから私は PHP で書いた単純な暗号のセットを持っています。最近、ツールセットの次の拡張機能は Ruby である必要があると判断しましたが、それらの新しいツールは、以前に構築した PHP ツールのセットと通信する必要があります。すべての PHP ツールを再構築したくありません。そのため、Ruby コードで PHP 暗号を正確に再現する必要があります。これにより、Ruby が文字列を暗号化するときに PHP ツールで暗号化された文字列が返され、暗号化された文字列が Ruby ツールで解読されます。

私の単純な暗号は、修正された Caesar 暗号です。Caesar 暗号 (名前に慣れていない人向け) は、すべての文字を 1 つの既知の文字数だけシフトする場所です。つまり、3 シフトすると、A が D に、B が E に、C が F に、というようになります。真の Caesar 暗号は次のようになります。 3のシフトがZをCに変えるようにラップを必要とします。ただし、私の場合はそうしません。Zに3を追加するだけで、PHPでutf8_encodeおよびutf8_decode関数を使用します。

今度は、Ruby で同等のものが必要です。私はそれを見つけたと思った

しかし、それはこのエラーを返します

未定義のメソッド「エンコード」 #

私のグーグルは、何らかの理由でRubyにはこれに対する単一の解決策がないことを示唆しています。Ruby は、文字列を UTF-8 にエンコードする前に、文字列の現在のエンコードを知る必要があります。少なくともそれが私が問題を理解した方法です。

したがって、入力される文字列は、Ruby 1.8.7 のデフォルトとなります。(これが役立つ場合...私はUbuntu 12.04デスクトップ、米国、英語を使用しており、デフォルトのリポジトリでapt-getを使用してRubyを取得したと思います。)SQLクエリステートメントのようなさまざまな文字列が必要です-「SELECT * FROM テーブル WHERE id = ?" PHP の md5() 出力によって生成された文字列。他のすべての文字列は、すべて米国英語の大文字、小文字、および数字のカテゴリに分類する必要があります。

ありがとう

0 投票する
2 に答える
376 参照

php - 不明な文字セットをutf8に変換する方法は?

文字列MühleをMühleとしてutf8データベースに保存しています。utf8も使用している私のWebページに正しく表示されるように、UTF8で表示したいと思います。

文字列をデータベースに書き込む前にutf8に変換されていなかったため、Webページに正しく表示されなくなったと思います。

mysqlデータベースからこの文字列を選択してutf8に変換しようとしましたが、機能しませんでした。また、何度もデコードしてみましたが、うまくいきませんでした。以下のコードを参照してください。

上記のコードの出力は、どちらの場合も入力と同じであり、文字列については何も変更されていません。

この文字列をmysqlデータベースで更新できるように変換し、次に選択したときにMühleとして正しく表示されるようにするにはどうすればよいですか?

0 投票する
2 に答える
1004 参照

javascript - JavaScriptを使用してxmlでUTF-816進コードを読み取る

要素テキストの一部としてEnDashとEmDashの文字を含むxmlファイルがあります。次のようにUTF-8コードに変換されます。

JavaScriptを使用してこれらのUTF-816進コードに対処し、必要なフリーテキストに置き換えたいと思います。

誰かがそれを行うためのアプローチを提案できますか?RegExを使用しようとしましたが、それらのコードを解析できませんでした。ただし、RegExを使用して他のテキストに対処することはできます。

ありがとうございました。

0 投票する
1 に答える
413 参照

perl - PerlのEncode::Detect::Detectorはどれほど「高価」か

さまざまなエンコーディングの「グレムリン」が、Perlプログラム内のデータベースからのフォーム入力とデータに混在するという問題が発生しています。最初、私はデコードしていませんでした。スマートな引用符などは、複数のぎこちない文字を生成していました。しかし、UTF-8としてすべてを盲目的にデコードすると、古いWindows-1252コンテンツが疑問符で埋められていました。

そのため、Encode :: Detector :: Detectorとdecode()関数を使用して、SQLデータベースからのデータとともにすべてのPOSTおよびGET入力を検出およびデコードしました(デコードプロセスは、おそらくそれぞれ10〜20文字のテキストで発生します)ページが生成される時間)。これは問題を解決しているように見えるので、UTF-8、ASCII、およびWindows-1252のコンテンツはすべてUTF-8出力として正しく表示されます(HTMLヘッダーで指定したとおり)。

私の質問はこれです:このプロセスはどれくらいのリソースが重いですか?減速に気づかなかったので、これがどのように機能するかについては満足していると思いますが、これを行うためのより効率的な方法があれば、それを聞いてうれしいです。

0 投票する
1 に答える
438 参照

python - Unicode 文字列を印刷するのと各文字を印刷するのとでは、何が一致しないのでしょうか?

私はmac os x lion、python 272を使用しています。文字列は正常に出力されますが、ループは「???」を出力します 不正な u'\u' Unicode 値とともに。

印刷された値は次のとおりです。