問題タブ [character-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
encoding - 文字エンコーディングの最適なリソース
文字エンコーディングについて詳しく説明しているドキュメント (印刷されていない) を探しています。
java - デフォルトの Java 文字エンコーディングの設定
JVM (1.5.x) で使用されるデフォルトの文字エンコーディングをプログラムで正しく設定するにはどうすればよいですか?
-Dfile.encoding=whatever
以前は、古い JVM の方法であったことを読んだことがあります。私が入りたくない理由で、私はその贅沢を持っていません。
私が試してみました:
getBytes
プロパティは設定されますが、以下の最終呼び出しで UTF8 が使用されるようには見えません。
coldfusion - RSS フィードの奇妙な文字を取り除く方法は?
データベースから取得したニュース データを表示する utf8 でエンコードされた RSS フィードを作成しました。データベースのすべての側面をutf8に設定し、データベースに入れたテキストをメモ帳に貼り付けてutf8として保存することで、utf8として保存しました。そのため、RSS フィードがブラウザーに表示されるときはすべて utf8 でエンコードする必要がありますが、シャープ記号の奇妙な疑問符文字が引き続き表示されます :(
これが私の RSS フィード コード (CFML) です。
誰か提案はありますか?私はたくさんの研究をしましたが、答えが見つかりません:(
前もって感謝します、
クロミス
.net - 文字エンコーディングの問題 - HttpWebRequest 経由で .NET によって読み取られる PHP 出力
サーバー上のいくつかのファイルの名前を出力する PHP スクリプト (Linux サーバー上で実行) があります。これらのファイル名を単純なテキストのみの形式で出力します。
この出力は、HttpWebRequest、HttpWebResponse、および StreamReader を使用して VB.NET プログラムから読み取られます。
問題は、出力されるファイル名の一部に... 異常な文字が含まれていることです。具体的には、「セクション」記号 (§) です。
PHP スクリプトの出力を Web ブラウザーで表示すると、シンボルは正常に表示されます。
しかし、PHP スクリプトの出力を .NET プログラムに読み込むと、シンボルが正しく表示されません (一般的な「ブロック」シンボルとして表示されます)。
応答ストリームを (HttpWebResponse から) 読み取るときに使用できるさまざまな文字エンコード オプションをすべて試しました。ストリームをテキスト ファイルに直接出力し (ダメ)、TextBox に表示しようとしましたが (ダメ)、結果を Visual Studio デバッガーで直接表示しても、文字がブロックとして表示されます。 「セクション」記号。
16 進数エディターで出力を調べました (関連する質問「文字エンコーディングの問題をどのようにトラブルシューティングしますか? 」で示唆されているように) 。
セクション シンボル (§) を .NET 自体から書き出すと、それを表す 16 進バイトは "c2 a7" になります (Unicode の場合は意味がありますよね? 2 バイトが必要ですか?)。PHP スクリプトからの出力を直接ファイルに書き出し、それを 16 進エディタで調べると、シンボルが「ef bf bd」と表示されます。2 バイトではなく 3 バイトですか?
他の文字エンコーディングを指定する必要がある場合、またはこれについて明らかな何かが欠けている場合、どうすればよいか途方に暮れています。
PHP スクリプトの出力を取得するために使用されるコードは次のとおりです (VB スタイルのコメントは、このサイトで正しく表示されるように変更されています)。
何か案は?
- 間違った種類の StreamReader を使用していますか? (新しい StreamReader を作成する呼び出しで文字エンコーディングを渡そうとしました - System.Text.Encoding にあるすべてのものを試しました - UTF-8、UTF-7、ASCII、UTF-32、Unicode、等。)
- PHP スクリプトの出力を読み取るために別の方法を使用する必要がありますか?
- テキストを出力するときに、PHP 側で別のことをする必要がありますか?
更新情報:
- PHP からの出力は、次のように呼び出して UTF-8 でエンコードされます。
utf8_encode($file);
- .NET からシンボルを書き出したとき、Windows の Character Map アプリからシンボルをコピーして貼り付けました。また、ファイル名 (Windows の場合) とこの Web ページ自体から直接コピーして貼り付けました。書き出すと、すべて同じ 16 進数の値になりました (c2 a7)。
- はい、私が話している「セクション シンボル」は U+00A7 (Windows では ALT+0167、Character Map によると) です。
- content-type は
header('Content-Type: text/html; charset=utf-8');
、PHP スクリプトの先頭で明示的に設定されます。
アップデート:
自分で考え出しましたが、回答者の助けがなければできませんでした。ありがとうございました!
c# - StreamReader の問題 - 不明なファイル エンコーディング (ウェスタン iso 88591)
入力ファイルからデータを読み取るときに、\ 記号が StreamReader によって読み取られていないことに気付きました。Mozilla Firefox では、入力ファイルの種類が Western (ISO-8859-1) として表示されました。
エンコーディング パラメータをいじってみると、次の値で正常に機能することがわかりました。
現在、「デフォルト」設定を使用することを計画していますが、これが正しい決定であるかどうかはよくわかりません. 既存のコードはエンコーディングを使用していないため、何かを壊すのではないかと心配しています。
私はエンコーディングについてほとんど(またはまったく)知りません。どうすればいいですか?System.Text.Encoding.Default を使用するという私の決定は安全ですか? ファイルを特定の形式で保存するようにユーザーに依頼する必要がありますか?
c# - ストリーミングファイルと文字セットの問題
ジャーナル記事の詳細をEndnoteというレファレンスマネージャーにエクスポートするコードを作成しました
そのフォーマットは以下のようなアイテムのリストです(著者):
残念ながら、私はどこかでいくつかのエンコーディングの問題を抱えています。endnoteがファイルを開くと、これが上記の作者の結果です。
SchortgeFrédérique
私は必死になって出力しているエンコーディングやものを試してみましたが、途方に暮れています。コードは次のとおりです。
vb6 - VB6 で実行時に特定の LCID の正しい文字セットを決定する最良の方法は何ですか?
システム ロケールを日本に設定し、Unicode 以外のプログラムの言語を日本語に設定して、VB6 アプリケーションで日本語の文字を表示しています。GetACP() を呼び出すと、日本語に対して正しく 932 が返されます。日本語の文字列をコントロールに挿入すると、「アフリカの女王」ではなく「ƒAƒtƒŠƒJ‚Ì—‰¤」と表示されます。Font.Charset を手動で 128 に設定すると、正しく表示されます。
VB6 で特定の LCID の正しい文字セットを決定する最良の方法は何ですか?
php - HTML Purifier を使用して適切に動作するにはどうすればよいですか?
PHP プロジェクトでHTML Purifierを使用していますが、ユーザー入力で正しく動作するのに問題があります。
ユーザーに WYSIWYG エディター ( TinyMCE ) を使用して HTML に入力させていますが、ユーザーが HTML エンティティ
(改行なしのスペース) に入力するたびに、この奇妙な外来文字 ( Â
) としてデータベースに保存されます。
ただし、保存したエントリを WYSIWYG エディタを使用して編集すると、 として適切に表示されます
。表示された場合も適切に機能しますが、ソース コードでは実際のスペースとして表示されますが、非改行スペース文字として表示されません。
また、MySQL データベースでは、奇妙な外来文字として表示されます。
Unicode と HTML Purifierに関するドキュメントを読み、データベースと Web ページのエンコーディングを UTF-8 に変更しましたが、非改行スペース文字が壊れていないという問題がまだあります。や などの他の HTML エンティティは、<
および>
として保存され<
ます>
が、なぜ
でしょうか?
django - DjangoのUnicodeアプリ名
私はノルウェーに住んでいて、Djangoアプリを作成するときに、「æøå」のような文字でアプリに名前を付けたいのですが、これらの文字はUnicodeで正常に機能しますが、アプリ名やフィールドでこれらの文字を使用しようとするとテキストを表示するエラーが発生します。
さらに良いことに、英語の規則に従ってアプリに名前を付けたいのですが、モデルだけでなく、アプリにも「verbose_name」のような名前を付けます。
では、モデルだけでなく、アプリの表示名を設定することは可能ですか?また、管理インターフェイスでUnicode文字を使用するにはどうすればよいですか?
.net - バイトコンテンツを Unicode から ANSI 文字に変換する際に (?) を削除する方法
Unicode 文字を ANSI 文字に変換する必要があります
このコードを使用します。これを表示しているときに、余分な ? キャラクターは最初の部分で追加されます
?FF EE 20 12