問題タブ [utf8-decode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1309 参照

java - Java は文字ストリームを人間が「読める」文字列に変換します

次のような文字がたくさんあります。

そして時々私はこのようなミックスを持っています:

最初は次のように変換されます。

Комуникационна кабелна система

そして2番目に:

ジェネラルリテ

ブラウザを使用してこれを表示し、本文に配置できます。

しかし、どうすればJavaに「実際の」文字を出力させることができますか? 上記のエンコーディングは何と呼ばれますか?

私はいくつかのことを試しましたが、最後にこれ(うまくいきませんでした):

0 投票する
3 に答える
3383 参照

perl - URLのキリル文字をエンコードしてからデコードする方法は?

1ページにフォームがあります:

入力フィールド「search_string」の 1 つを使用してキリル文字を送信できます。その場合、URL 文字列は次のようになります。

投稿先のページでこれをデコードして元の文字列に戻すにはどうすればよいですか?

0 投票する
3 に答える
954 参照

php - 私のスクリプトは正常に動作しますが、なぜ utf8_decode() を使用しなければならないのか混乱しています

utf8_decode() の動作について混乱しており、少し説明が必要です。大丈夫だと思います。

テキストをキャプチャして MySQL データベースに保存するために使用している単純な HTML フォームを次に示します (これは utf8_general_ci 照合順序を使用します)。

ご覧のとおり、適切な場所で charset=utf8 を使用してこれをコーディングしました。分音符号 (例: ñ、ó など) を含むテキストを受け入れます。最後に、すべてのテキスト入力に対して小さなスクリプトを実行して分音記号をチェックし、それらを HTML エンティティに変更します (例: ñ は ñ になります)。

スクリプトが入力を受け取ると、最初に utf8_decode($input) を実行し、次に小さなスクリプトを実行して分音記号をチェックし、必要に応じて変更する必要があります。すべて正常に動作します。この入力でデコードを実行する必要がある理由が気になります。utf8_decode は、UTF-8 でエンコードされた文字列を ISO-8859-1 に変換することを理解しています。すべてが正常に機能している (またはそう思っている) 場合でも、後で追いつくような厄介なことをしていないことを確認したいと思います。たとえば、UTF-8 文字を保存/提供するように設定されているデータベースに保存するために、ISO-8859-1 でエンコードされた文字を送信しています。分音記号からエンティティへのスクリプトが返す文字列に対して utf8_encode() を実行するようなことをする必要がありますか? 例えば:

これについて誰かが提供しなければならない洞察に感謝します。

0 投票する
0 に答える
73 参照

django-testing - Django テストからエスケープされていない utf-8 出力を取得するにはどうすればよいですか?

Python 2.7 で Django 1.3 を使用すると、次のようなテストケースが作成されます。

出力が得られます:

が見たいです:

端末は utf-8 をサポートし、utf-8 は他の場所ではエスケープされずに出力され、テストからの出力のみがエスケープされます。

  • self.fail(msg.encode('utf-8')) を実行しようとしましたが、UnicodeDecodeError が発生します。
  • DEFAULT_CHARSET と TESTING_CHARSET を設定してみましたが、効果がありません。

この出力を得るには何を変更する必要がありますか?

0 投票する
1 に答える
5609 参照

python - urllib: utf-8 でエンコードされたサイトのソース コードを取得する

あるウェブサイトのセグメントを取得しようとしています。スクリプトは機能しますが、á、é、í、ó、ú などのアクセントのある Web サイトです。

urllib または urllib2 を使用してサイトをフェッチすると、サイトのソース コードが utf-8 でエンコードされません。utf-8 はこれらのアクセントをサポートしているためです。

ターゲット サイトには次のメタ タグが含まれているため、utf-8 でエンコードされていると思われます。

私のpythonスクリプト:

ただし、utf-8 でエンコードされていないように見える結果が得られます。

例: ウェブサイトの "Milán" = urllib2 が取得した後の "Mil\xe1n"

助言がありますか?

0 投票する
1 に答える
96 参照

html - 値を保存する際のエンコードの問題にスペース文字が含まれている

Rails 3.2.3 を使用しています。いくつかの html データをデータベースに保存したいのですが、保存中にエンコードされます。そのため、これらの html データを表示しようとすると、プレーン テキストとして表示されます。エンコードされたデータを保存する代わりに、純粋な html タグをデータベースに保存したい。どうすればこれを解決できますか...

ありがとうございます

0 投票する
1 に答える
7786 参照

php - PHP-utf8_decode()を間違った文字に

Twitter検索APIを使用しようとしています。utf8_decodeリツイートされたツイートを呼び出すと、スピーチマーク/引用符が疑問符として表示されます...

コード:

出力:

他のすべての記号は正しく表示されます。

使用する言語を設定する必要がありますか?私が行ったアトムクエリやその他のことを知りたい場合は、私に知らせてください。

0 投票する
2 に答える
7481 参照

c# - HttpWebRequest の応答に UTF-8 記号が表示されない

Web サイトから応答を取得するための簡単なコードがありますが、小さな問題が 1 つあります。ロシアのWebサイトから応答を得ようとしています.1つのWebサイトからは記号を知らず、他のWebサイトからは通常のテキストを取得しています. どこに問題があるのでしょうか?

返信先: www.kinopoisk.ru

������ � ����...

返信先: www.yandex.ru

Греция - Чехия。1:2...

0 投票する
2 に答える
259 参照

php - PHP - UTF-8 エンコーディング/デコーディングは必要ですか?

OK、以下の関数内で読み取った UTF-8 ファイルにコメントを書き込んで、これらのコメント間のテキストを削除しています。私の質問は、UTF-8 ファイルに対してこれを正常に行うために、ここで何か違うものが必要ですか? または、以下のコードは機能しますか? utf8_decode基本的に、機能が必要かどうか、またはutf8_encode機能する必要があるかどうか疑問に思っていiconvます。

コメント付きの文字列であっても、文字列の UTF-8 エンコーディングとデコーディングに関してご協力いただきありがとうございます。

PHPコメントをUTF-8ファイルに書き込むとき、変換を使用していません。私はすべきですか?ただし、php コメント間の文字列定義は既に UTF-8 でエンコードされており、ファイル内で正常に機能しているようです。ここで助けていただければ幸いです。

0 投票する
2 に答える
1904 参照

c# - C# での二重引用符を使用した文字列の UTF-8 エンコード

デコードされた<?xml version=\"1.0\" encoding=\"UTF-8\"?>

\" 私の質問は、メッセージを引用符でエンコードし、decdoing せずに文字列を取得する\"方法です\r\n