問題タブ [utf-8]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
25373 参照

php - RSS フィードの utf-8 と htmlentities

PHP でいくつかの RSS フィードを作成していて、文字エンコードの問題に苦労しています。htmlentities() エンコーディングの前または後に utf8_encode() する必要がありますか? たとえば、description 要素にアンパサンドと漢字の両方が含まれていますが、どちらが適切かわかりません。

なぜ?

0 投票する
3 に答える
35624 参照

c - Light C Unicode ライブラリ

utf8 文字列を処理する小さな C ライブラリを探しています。

具体的には、ステミング アルゴリズムで使用するための Unicode 区切り記号に基づく分割です。

関連する投稿は次のことを示唆しています:

ICU http://www.icu-project.org/ (組み込みデバイスでの目的には大きすぎることがわかりました)

UTF8-CPP: http://utfcpp.sourceforge.net/ (優れていますが、C++ ではありません)

ユニコード文字列を処理するための、プラットフォームに依存しない小さなコードベース ライブラリを見つけた人はいますか (帰化を行う必要はありません)。

0 投票する
3 に答える
8953 参照

perl - 文字列の文字セットを決定するにはどうすればよいですか?

いくつかの異なる言語のファイルがいくつかあります。それらはすべてUTF-8でエンコードされていると思っていましたが、今はよくわかりません。きれいに見える文字もあれば、そうでない文字もあります。文字列を分割して文字セットを特定する方法はありますか? おそらく、空白で分割してから、各単語を識別しますか? 最後に、あるセットの文字を UTF-8 に変換する簡単な方法はありますか?

0 投票する
5 に答える
3998 参照

asp.net - ANSI でエンコードされたファイルを UTF-8 に変換すると、何が問題になる可能性がありますか?

Team Foundation Server 2005 に保存されている既存の ASP.NET 2.0 Web サイトがあります。一部のページ/コントロールは ANSI としてエンコードされ (Notepad++ に従って)、Content-Type ヘッダーは次のように設定されています。

すべてのページを UTF-8 に変更したいので、Content-Type ヘッダーを次のように変更します。

meta 要素を変更する以外に、すべてのファイルのエンコーディングも変更する必要があると思います。Notepad ++でこれを行うことができますが、より速い方法がある場合は、それらについて言及してください。

TFS でのマージ/比較に関して、どのような問題に直面する可能性がありますか?

0 投票する
5 に答える
34842 参照

java - Java での HTTP ヘッダーのエンコード/デコード

カスタム HTTP ヘッダーが、認証のためにサーブレット アプリケーションに渡されています。ヘッダー値には、アクセントやその他の非 ASCII 文字を含めることができる必要があるため、特定のエンコーディング (理想的には UTF-8) である必要があります。

認証環境を制御する開発者から、次の Java コードが提供されました。

しかし、このコードは私には正しく見えません: ヘッダー値のエンコーディングを指定する適切な方法があるように思えたときに、ヘッダー値のエンコーディングを前提としています (MIME からだと思います)。

ここに私の質問があります: UTF-8 エンコーディングをサポートする必要があるカスタム ヘッダー値を処理する正しい方法 (tm) は何ですか:

  • ワイヤー上 (ヘッダーがワイヤー上でどのように見えるか)
  • デコードの観点から (Java Servlet API を使用してデコードする方法、および request.getHeader() が既に適切にデコードを行っていると仮定できます)

サービスを変更できない場合にヘッダーを UTF-8 として扱う環境に依存しないコード サンプルを次に示します。

0 投票する
3 に答える
1895 参照

configuration - web.xml の error-page ディレクティブが UTF8 を正しく表示しない

次のエントリを持つアプリケーション web.xml があります。

ただし、このページを表示すると日本語の文字化けが発生します。

同じページ (p_notfound.jsp) が、直接表示された場合、またはサーブレット フィルターを介して表示された場合でも正しく表示されます。

フィルターを追加してみました:

しかし、それは役に立ちません。何か案は?

0 投票する
3 に答える
3240 参照

coldfusion - ファイルをUTF-8形式で保存する方法

ColdFusionでポンド(通貨)記号を含む電子メールを送信する必要があります。メールを送信する前に、プレビュー用にデータをhtmlファイルにダンプしています。

  1. ColdFusionでutf-8エンコーディングを使用してメールを送信する方法
  2. utf-8エンコーディングでファイルをColdFusionに保存する方法
0 投票する
3 に答える
13595 参照

ruby-on-rails - Rubyを使用してUTF-8メールヘッダー(Subject:など)を処理するには?

私は電子メール n00b ですが、Unicode 文字を含む HTML 電子メールを送信するアプリケーションに取り組んでいます (私の友人が「エンコーディング地獄を楽しんでください」と述べたように)。

ヘッダーはSubject:ユーザー入力から取得されるため、Unicode 文字が含まれる場合があります。一部のメール クライアント (GMail や Outlook 2007 など) はこれで問題ありませんが、私の読みでは、ヘッダーにMIME Encoded-Word エンコーディングを使用するのが正しい方法のようです。

これを行うための Ruby ライブラリが見つかりません。ありますか?

また、メッセージを表示するときに UTF-8 を使用するようにメール クライアントに指示する追加するヘッダーはありますか? マルチパートメールを送信しているのでContent-Typemultipart/mixed. 特に Apple Mail.app は、個々の部分で UTF-8 として指定されているにもかかわらず、正しいエンコーディングを使用していません。

0 投票する
7 に答える
18354 参照

mysql - RailsでのUTF8MySQLの問題-utf8_general_ciでのエンコーディングの問題

MySQL5.0.32-Debianで実行されているステージングRailsサイトがあります。

この特定のサイトでは、すべてのテーブルがutf8 / utf8_general_ciエンコーディングを使用しています。

そのデータベースの中に、次のようなデータがあります。

これが私が抱えている問題です

ステージング時(dbおよびRailsサイトがdebianボックスで実行されている場合)、Railsから表示されたときにシンボルの文字が正しく表示されます。たとえば、中国人民元は、データベース内に表示されているように、私のブラウザでは元として表示されていますが、å…ƒではありません。

そのデータをローカルのOSX開発マシンにダウンロードし、dbとRailsをローカルで実行すると、ステージングで表示される文字元ではなく、ブラウザーのDB(å…ƒ)内からの表現が表示されます。

私が行ったデバッグ

Content-Typeのすべてのヘッダーが各Webサーバー(ローカル、ステージング)からutf8として返されることを確認しました。

私のローカルmysqlサーバーとステージングサーバーは両方とも、デフォルトの文字セットとしてutf8を使用するように設定されています。電話をかける前に「setnames'utf8'」を使用しています。

OS X Railsホストからステージングデータベースに接続することもできますが、人民元を表す文字å…ƒが表示されます。おそらく、mysqlローカルクライアントに問題があると思いますが、問題が何であるかを理解できません。

おそらくこれは手がかりを与えるかもしれません

さらに混乱させるために、ローカルマシンのデータベースに元という文字を貼り付けると、Webブラウザで問題なく表示されます。---それでも、同じ文字をステージングデータベースに貼り付けると、?ステージングRailsサイトのページのその場所にマークを付けます。

また、OS X Railsマシンでローカルに、クエリの前に「set names'latin1'」を使用すると、すべての文字が正しく返されます。以前、これらのテーブルをlatin1として設定していましたが、これが問題になる可能性がありますか?

誰かがここで私を助けてください、私は何が悪いのかを理解しようと夢中になっています!

0 投票する
3 に答える
12413 参照

mysql - MySQL 5 での UTF8 の問題

WordPress ブログと phpBB フォーラムを新しいホスティング サーバーに移行しています。phpMyAdmin を使用して、以前のサイトのデータベースから SQL スクリプトをインポートしています。

Kate で .sql スクリプトを開くと、エンコーディングとして UTF8 を使用していると表示されます。新しいサーバーにSQLをインポートすると、phpMyAdminにエンコーディングを選択するオプションがあり、デフォルトでutf8が選択されています。

それでも、データベースのインポートが完了すると、投稿テキストを phpMyAdmin で直接読み、「é」、「ñ」などの文字が「解釈」されておらず、挿入された奇妙な文字に置き換えられているのを確認します。

WordPress のインストールも機能していないことがわかります。どうやらこのエンコーディングに問題があるようですが、WordPress ではなく、MySQL データベースまたは phpMyAdmin に問題があると思います。

MySQL のバージョンは実質的に同じ MySQL 5 ですが、リビジョンが異なります。また、フォーラムデータベースの移行時は問題なかったので、これはさらに奇妙です...

これを修正する方法がわかりません...どんなアイデアでも大歓迎です。