問題タブ [windows-1252]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
176 参照

android - Androidスタジオのプロジェクトエンコーディングとは?

私は当初、ファイルエンコーディングの不一致の問題を抱えていました。それは私が修正しましたが、それはプロジェクトのエンコーディングとIDEのエンコーディングを意味しますか?

また、使用するエンコーディングと、他のエンコーディングの制限は何ですか?

私はアンドロイドとプログラミングも初めてです。そのため、詳細な回答またはリンクを提供して、それに関する詳細情報を見つけてください。

0 投票する
1 に答える
1611 参照

php - PHP の mb_detect_encoding および mb_check_encoding 関数の結果を理解する

と の 2 つの関数のロジックを理解しようとしてmb_detect_encodingmb_check_encodingますが、ドキュメントが貧弱です。非常に単純なテスト文字列から始めます

Windows-1252エンコーディングを使用する場合、小文字の「a」の後に中括弧が続きます。

次の結果が得られます。

  • https://en.wikipedia.org/wiki/ISO/IEC_8859-1およびmb_detect_encodinghttps : / /en.wikipedia.org/wiki/Windows-1252、バイトx92は Windows-1252 文字エンコーディングで定義されていますが、ISO-8859-1 では定義されていません。

  • mb_detect_encoding第二に、 を返す方法がわかりませんが、同じ文字列と同じ文字エンコーディングを返すことfalsemb_check_encodingできます。true

  • 最後に、厳密モードであるかどうかにかかわらず、文字列が UTF-8 として検出される理由がわかりません。バイトx92は UTF-8 の継続バイトですが、この文字列では、シーケンスの先頭のバイトではなく、有効な文字バイトに続いています。

0 投票する
0 に答える
437 参照

java - Windows-1252 の Java エンコーディング ファイルは、メモ帳 ++ で Big5 に表示されます

エンコーディング "windows-1252" でファイルを書き込むときに問題に直面しています:正確なタイミングはわかりませんが、ファイルが Big5 (中国語) でエンコードされている場合があります。notepad ++でエンコーディングを制御します

たとえば、文字列 "¤idParam¤vidProduit1¤¤idParam2¤v2¤v" は (windows-1252 ファイルで) 適切にエンコードされていますが、文字列 "¤¤idParam¤vidProduit1¤¤idParam2¤v2¤v" は正しくエンコードされていません。

私はEclipse Marsとjdk1.8.0_92でテストしています。

それをテストする私のコード:

ファイル "file_ok.txt" は notepad++ では "ANSI" ですが、ファイル "file_ko.txt" は notepad++ では "Big5 Traditional" です。

多くのケースをテストしましたが、何が問題なのか特定できませんでした。非常に奇妙です...

ご協力いただきありがとうございます。

0 投票する
1 に答える
252 参照

python - 人名の Python エンコーディング

名、姓、住所などの個人情報を含むutf-8でエンコードされたpostgresdwhにデータをロードしています。これらの値には、ドイツ語の文字やumlautsフランス語の文字などをé, â, à含めることができます。データは Excel ファイルからデータフレームに読み込まれ、postgresql データベースにプッシュされます。以前、エンコード エラーを回避するために次の行を使用しました。たとえば、名の値については次のようになります。

別のエラーが発生したフランス語の文字に遭遇しました。

エンコーディングを次のように変更しました。

ただし、スクリプトをそのままにしておくと、ドイツ語の文字を含む値は読み込まれません。windows-1252は西ヨーロッパ言語に使用され、これらすべての特殊文字を処理できるはずだと思いました。これらすべての言語に適用される代替エンコーディングはありますか? または、処理された値に基づいてエンコーディングを変更する必要がありますか?