問題タブ [utf8-decode]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
6384 参照

php - UTF8 リアルデコード

おそらく非常に単純な質問ですが、utf8文字を読み取り可能な文字にデコードする方法を知りたいと思っていました.

例えば ​​:

の中へ

L'heure suprême

私は次のことを試しました:

たとえば、出力で正しい文字が得られませんでした

編集:それはばかげた質問 html_entity_decode($string, ENT_COMPAT, "ISO-8859-15");でした、トリックをしました

0 投票する
2 に答える
8497 参照

c# - C#、UTF-8、エンコーディング文字

これは暗闇の中のショットであり、この質問が狂人のとりとめのないように聞こえる場合は、事前にお詫び申し上げます.

サード パーティとの統合の一環として、C# を使用して一部の文字列情報を UTF8 エンコードする必要があるため、マルチパート フォーム経由でターゲット サーバーに送信できます。問題は、おそらく私が内容を正しくエンコードしていないために、彼らが私の投稿の一部を拒否していることです。

現在、ダッシュまたはハイフンがどのように受信され、ターゲット サーバーによってどのように解釈されるかを理解しようとしてい?~@~Sます。ブラウザの不具合ではありません)。Encoding.UTF8.GetBytes()残念ながら、バイト配列を使用して問題がどこにあるのかを特定する方法を十分に理解していません。

誰かがヒントやアドバイスを提供できる場合は、それをいただければ幸いです。これまでのところ、私の唯一の友人は MSDN であり、MSDN の友人はほとんどいません。

更新 1 : さらに掘り下げた後System.Web.HttpUtility.UrlEncode()、EM DASH 文字 ("—") をエンコードするために使用すると、"%e2%80%94" に 16 進エンコードされることがわかりました。

HttpWebRequest現在、この情報を「application/x-www-form-urlencoded」というコンテンツ タイプの投稿で送信しています。これが問題の原因でしょうか? もしそうなら、値に Unicode 文字が含まれている可能性のある一連の名前と値のペアをエンコードして、UTF-8 要求を期待しているサーバーが理解できるようにする適切な方法は何ですか?

0 投票する
4 に答える
1289 参照

php - スペースをstr_replaceできません

私はグーグルから数字の文字列を引き出してクリーンアップしようとしています。

しかし、私が持っている番号にはスペースがあります。針「」または「 」に置き換えてみました。またはutf8_encode、$contentをデコードします。それらのどれも動作しません。

0 投票する
2 に答える
5537 参照

php - PHP で URLENCODED データを UTF-8 に変換する

中华武魂私のウェブサイトを介してデータを取得するリクエストを投稿するときのように、データベースにある文字列を持っています。データを次の形式でサーバーに取得しています%E4%B8%AD%E5%8D%8E%E6%AD%A6%E9%AD%82

使用可能な形式に戻すには、どのようなデコード手順を実行する必要がありますか? また、ユーザー入力をクリーンアップして、SQL インジェクション攻撃を試みないようにしますか? (エンコード前またはエンコード後のエスケープ文字列?)

編集:

... SQLステートメントで試して使用すると実際に機能します。

echoUTF-8のヘッダーを指定せずにandを実行していたためだと思いますdie(); (したがって、ラテン語として読んでいたと思います)

助けてくれてありがとう!

0 投票する
3 に答える
375 参照

c# - UTF8 ファイルのランダム読み取りを実行するにはどうすればよいですか

私の理解では、UTF8 または UTF16 でエンコードされたファイルへの読み取りは、時折のサロゲート バイト (東部言語などで使用される) のために必ずしもランダムであるとは限りません。

.NET を使用してファイル内のおおよその位置にスキップし、半ランダムな位置から Unicode テキストを読み取るにはどうすればよいですか?

サロゲート バイトを破棄し、ワード ブレークを待って読み取りを続行しますか? もしそうなら、デコードを開始するまで待つべき有効な単語区切りは何ですか?

0 投票する
4 に答える
310395 参照

php - これらの奇妙な文字を変換するにはどうすればよいですか? (ë, Ã, ì, ù, Ã)

私のページには、通常の文字の代わりに、ã、ã、ã¬、ã¹、ã などの文字が表示されることがよくあります。

ヘッダー ページと MySQL エンコードに utf8 を使用します。これはどのように起こりますか?

0 投票する
2 に答える
3526 参照

python - Python 2.6 で utf-8 でエンコードされたクエリ パラメータを解析する方法

私のウェブサイトに素敵な (スカンジナビア?) ユーザーがいて、URL で彼のユーザー名を解析できないと不満を漏らしているため、私のウェブサイトの彼のページに結果が表示されません。

ブラウザがリクエストをhttp://councilroom.com/player?player=G%C3%B6rlingとしてエンコードしていると確信してい ます

プレーヤーの文字列を、変換中の Görling ではなく、Görling にしたいと考えています。

私はpython 2.6でweb.pyを使用しており、次のようにURLを解析しようとしています

編集:unutbuの助けを借りて、これを次のように変更して修正しました

webpy は何らかの形で web.ctx のフルパスを誤って解析していたと思いますが、QUERY_STRING 変数は無害です。

0 投票する
1 に答える
311 参照

iphone - 文字列に非ローマ字を表示する

私のアプリでは、リモートホストから次のような文字列を受け取ります。 U00a7-\ U00c8 \ U00d4 \ U00c3 \ U00d4 \ U00be \ U00c3 \ U00cd \ U00d3 \ U00e4 "

これはタイ語の文字列であることを私は知っています。NSLogのUILabelを使用して表示すると、次のように表示されます。

01-«ÓºÒ´Õ・Õè¤Ò¹・ͧ--ÈÔÃÔ¾ÃÍÓä

タイ語フォントを使用して文字列を正しく表示する方法はありますか?

ありがとう、

0 投票する
2 に答える
4638 参照

c# - FileUpload サーバー制御と Unicode 文字

FileUpload サーバー コントロールを使用して、以前に保存された (Web ページとして、フィルター処理された) HTML ドキュメントを MS Word からアップロードしています。文字セットは windows-1252 です。ドキュメントには、通常の引用符だけでなくスマート引用符 (curly) も含まれています。また、よく見ると通常の TAB や SPACE 以外の文字である (どうやら) いくつかの空白スペースがあります。

StreamReader でファイルの内容をキャプチャすると、これらの特殊文字は疑問符に変換されます。デフォルトのエンコードがUTF-8で、ファイルがUnicodeであるためだと思います。

私は先に進み、Unicode エンコーディングを使用して StreamReader を作成し、不要な文字をすべて正しい文字 (stackoverflow で実際に見つけたコード) に置き換えました。これはうまくいくようです....文字列をUTF-8に変換してasp:literalに表示することはできません。コードはそこにあり、動作するはずです....しかし、出力(ConvertToASCII)は判読できません。

以下をご覧ください。

また、前に言ったように、単語 doc に番号付けされたインデントがある場所に対応しているように見える「透明な」文字がいくつかあります。それらのユニコード値をキャプチャしてそれらを置き換える方法がわかりません....ヒント、教えてください。

よろしくお願いします!