問題タブ [utf8-decode]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

210 問題

0 投票する

3 に答える

4660 参照

node.js - node.js で utf-8 デコードエラーをキャプチャするにはどうすればよいですか?

Node (テスト済み: v0.8.23、現在の git: v0.11.3-pre)は、バッファー処理でデコードエラーを無視し、'\ufffd' utf8 以外の文字を(Unicode REPLACEMENT CHARACTER) で例外をスローするのではなく、静かに置き換えます。非 utf8 入力。その結果、fs.readFile、process.stdin.setEncodingおよび友人は、大量の不適切な入力エラーをマスクします。

失敗しないが本当に失敗するべき例:

'\ufffd'は正当な utf8 で (シーケンスとしてef bf bd) 発生する可能性がある完全に有効な文字であるため、結果に表示される this に基づくエラー処理でモンキーパッチを適用することは自明ではありません。

もう少し深く掘り下げると、これはノードがv8の文字列を延期するだけであり、それらは上記の動作をしており、v8には外部でエンコードされたデータでいっぱいの外部世界がないことが原因のようです。

入力文字列またはバッファでエラーが発見された場所に関するコンテキストを使用して、utf-8 デコードエラーをキャッチできるノードモジュールなどはありますか?

2013-06-09T05:39:10.270

0 投票する

2 に答える

1046 参照

python - Python: 解析されたクエリ (MeCab) から返された文字列の Unicode エンコード

日本語テキストの構文解析を行う MeCab というプログラムを使用しようとしています。私が抱えている問題は、バイト文字列を返し、それを印刷しようとすると、ほとんどすべての文字に疑問符が表示されることです。ただし、使用しようとすると.decode、エラーがスローされます。これが私のコードです：

これは私の出力です：

また、私の端末は日本語の文字を正しく表示できます。たとえば、print '日本語'完全に正常に動作します。

何か案は？

python unicode utf-8 cjk utf8-decode

2013-06-29T11:43:38.823

0 投票する

1 に答える

133 参照

perl - バックスラッシュが 2 つ付いた PERLQQ エスケープ文字列を Perl 文字にデコードするにはどうすればよいですか?

semi-utf8 エンコーディングを含むファイルから行を読み取り、それをさらに操作するために Perl 内部表現に変換したいと考えています。

file.in (プレーン ASCII):

これらは MOŽNÁ と NOVÁ に変換されます。

行をロードし、適切な utf8 表記にアップグレードします。\\xc5\\xbd -> \x{00c5}\x{00bd}. 次に、これをアップグレード$lineして、perl を内部的に表現するようにします。

残念ながら、成功しませんでした。

perl utf8-decode

2013-07-12T10:50:05.487

0 投票する

1 に答える

340 参照

scala - Play2 の play.api.libs.ws.Response を Scala で UTF-8 に強制的にデコードしますか?

サイトhttp://dilbert.comからコンテンツを取得すると、無効なエンコーディング utf-8lias が表示されます。もちろん、そのようなエンコーディングは存在しませんが、サイトが教えてくれることに影響を与えることはできません。

この結果、play.api.libs.ws.Response オブジェクトは UnsupportedEncodingException をスローします。

[エラー] アプリケーション - エラー: java.io.UnsupportedEncodingException: utf-8lias

もちろん、サイトが提供するエンコーディングが明らかに間違っている場合でも、コンテンツは UTF-8 です。

とにかく、Scala WS レスポンスにレスポンスを UTF-8 としてデコードさせることはできますか?

scala playframework-2.0 utf8-decode

2013-07-19T15:32:20.213

0 投票する

1 に答える

850 参照

php - MySQL 変換文字セットの問題

PHP 5 で実行され、 mysqli拡張機能を使用して MySQL データベースにアクセスして保存するアプリケーションがあります。データベースには、エンコードがUTF-8 (照合utf8_swedish_ci ) の多数のテーブルが含まれています。

残念ながら、mysqli 接続は ISO-8859-1 を使用してすべてをエンコードするように構成されているようです。これは、latin1データを含むUTF-8テーブルを取得したことを意味します。すべてをUTF-8に移行することで、これを修復しようとしています（そうあるべきです！）

これを処理する組み込みの方法はありますか？そうでない場合、この問題にどのようにアプローチすることをお勧めしますか?

編集: PHPMyAdmin を使用してすべてを参照しているときにデータがどのように見えるかのサンプル:

handelÃ«（はずですhandelë）

âˆšskal（はずです√skal）

また、出力エンコーディング UTF-8 を使用する限り、データは HTML ドキュメントに正しく出力されますが、mysqli 接続文字セットは latin1 として維持されます。それはすべてかなり混乱しています。

あなたの助けにとても感謝しています！

php mysql character-encoding utf8-decode

2013-08-04T11:46:06.617

0 投票する

2 に答える

505 参照

ruby - Encoding::UndefinedConversionErrorがwatirにあるドロップダウンを選択する方法は?

text="Côte d'Ivoire"を持つドロップダウンを選択したい。

私はこれらのコードを試しました、

1.encoding: UTF-8 #動作しない

2.text.force_encoding("ASCII-8BIT").encode('UTF-8', undef: :replace, replace:'') #text=コートジボワール

私はそれのために何をすべきですか？ また、このテキストを自分の DB に保存したいのですが、助けてください。

ruby utf-8 watir utf8-decode

2013-08-07T07:13:56.000

1 2 3 4 5 6 7 8 9 10

問題タブ [utf8-decode]

node.js - node.js で utf-8 デコード エラーをキャプチャするにはどうすればよいですか?

python - Python: 解析されたクエリ (MeCab) から返された文字列の Unicode エンコード

perl - バックスラッシュが 2 つ付いた PERLQQ エスケープ文字列を Perl 文字にデコードするにはどうすればよいですか?

scala - Play2 の play.api.libs.ws.Response を Scala で UTF-8 に強制的にデコードしますか?

php - MySQL 変換文字セットの問題

ruby - Encoding::UndefinedConversionErrorがwatirにあるドロップダウンを選択する方法は?

Reference

node.js - node.js で utf-8 デコードエラーをキャプチャするにはどうすればよいですか?