問題タブ [windows-1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - Androidスタジオのプロジェクトエンコーディングとは?
私は当初、ファイルエンコーディングの不一致の問題を抱えていました。それは私が修正しましたが、それはプロジェクトのエンコーディングとIDEのエンコーディングを意味しますか?
また、使用するエンコーディングと、他のエンコーディングの制限は何ですか?
私はアンドロイドとプログラミングも初めてです。そのため、詳細な回答またはリンクを提供して、それに関する詳細情報を見つけてください。
php - PHP の mb_detect_encoding および mb_check_encoding 関数の結果を理解する
と の 2 つの関数のロジックを理解しようとしてmb_detect_encoding
いmb_check_encoding
ますが、ドキュメントが貧弱です。非常に単純なテスト文字列から始めます
Windows-1252エンコーディングを使用する場合、小文字の「a」の後に中括弧が続きます。
次の結果が得られます。
https://en.wikipedia.org/wiki/ISO/IEC_8859-1および
mb_detect_encoding
https : / /en.wikipedia.org/wiki/Windows-1252、バイトx92
は Windows-1252 文字エンコーディングで定義されていますが、ISO-8859-1 では定義されていません。mb_detect_encoding
第二に、 を返す方法がわかりませんが、同じ文字列と同じ文字エンコーディングを返すことfalse
がmb_check_encoding
できます。true
最後に、厳密モードであるかどうかにかかわらず、文字列が UTF-8 として検出される理由がわかりません。バイト
x92
は UTF-8 の継続バイトですが、この文字列では、シーケンスの先頭のバイトではなく、有効な文字バイトに続いています。
java - Windows-1252 の Java エンコーディング ファイルは、メモ帳 ++ で Big5 に表示されます
エンコーディング "windows-1252" でファイルを書き込むときに問題に直面しています:正確なタイミングはわかりませんが、ファイルが Big5 (中国語) でエンコードされている場合があります。notepad ++でエンコーディングを制御します
たとえば、文字列 "¤idParam¤vidProduit1¤¤idParam2¤v2¤v" は (windows-1252 ファイルで) 適切にエンコードされていますが、文字列 "¤¤idParam¤vidProduit1¤¤idParam2¤v2¤v" は正しくエンコードされていません。
私はEclipse Marsとjdk1.8.0_92でテストしています。
それをテストする私のコード:
ファイル "file_ok.txt" は notepad++ では "ANSI" ですが、ファイル "file_ko.txt" は notepad++ では "Big5 Traditional" です。
多くのケースをテストしましたが、何が問題なのか特定できませんでした。非常に奇妙です...
ご協力いただきありがとうございます。
python - 人名の Python エンコーディング
名、姓、住所などの個人情報を含むutf-8でエンコードされたpostgresdwhにデータをロードしています。これらの値には、ドイツ語の文字やumlauts
フランス語の文字などをé, â, à
含めることができます。データは Excel ファイルからデータフレームに読み込まれ、postgresql データベースにプッシュされます。以前、エンコード エラーを回避するために次の行を使用しました。たとえば、名の値については次のようになります。
別のエラーが発生したフランス語の文字に遭遇しました。
エンコーディングを次のように変更しました。
ただし、スクリプトをそのままにしておくと、ドイツ語の文字を含む値は読み込まれません。windows-1252
は西ヨーロッパ言語に使用され、これらすべての特殊文字を処理できるはずだと思いました。これらすべての言語に適用される代替エンコーディングはありますか? または、処理された値に基づいてエンコーディングを変更する必要がありますか?