問題タブ [iso-8859-15]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
3624 参照

python - Pythonでiso-8859-15変換のユニコードエンコーディングを正規化するには?

Unicode 文字列を iso-8859-15 に変換したい。これらの文字列には、iso-8859-15 文字セットの一部ではないu"\u2019"(RIGHT SINGLE QUOTATION MARK http://www.fileformat.info/info/unicode/char/2019/index.htmを参照) 文字が含まれます。

Python では、iso-8859-15 エンコーディングに一致するようにユニコード文字を正規化する方法は?

私は成功せずに unicodedata モジュールを見てきました。私はなんとか仕事をすることができます

しかし、より一般的でクリーンな方法を見つけたいと思います。

ご協力いただきありがとうございます

0 投票する
1 に答える
13582 参照

utf-8 - フランス語文字の文字エンコードの問題

Webアプリケーションには、以下のエンコーディングのHTMLページがあります。

実際に起こっていることは、このページで私は石鹸リクエストの結果を表示しようとしています。このsoap-requestに応答して、次のコードを取得しています。

次の文字の場合:

驚くべきことに、HTMLページでは、ページのエンコーディングがUTF-8であることに加えて、これらの文字は次のように正しく表示されます。

これらのコードはISO-8859-15に属しているため、UTF-8形式でこれらのコードを正しく変換する方法を理解できません。何か考えはありますか?

0 投票する
0 に答える
509 参照

ruby - iso-8859-15 でファイルを保存できません

iso-8859-15 でエンコードされたファイルをレールで生成する必要があります。これを行うために、次のコードを使用しています。

問題は、ファイルのエンコーディングを見ると iso-8859-1 を使用しているため、€ などの記号に問題があることです。私は何時間もインターネットをサーフィンしてきましたが、ルビーのものが見つかりません。

前もって感謝します。

編集:

これは、iso-8859-15 に変換するために使用する方法です。

0 投票する
1 に答える
2587 参照

java - 疑問符としての FreeMarker 特殊文字出力

0 投票する
2 に答える
1342 参照

java - アクセント付きの文字はすべて疑問符に変わります

アクセント付きの文字を含むファイルがあります。ÇÍââÇÍ

それらをISO-8859-15エンコーディングに変更する必要があります

コード:

しかし、私は出力として得ます:

0 投票する
1 に答える
1724 参照

python - UTF 8 システムの ISO 8859-15 ファイルでドイツ語のウムラウトを置き換える

Pythonとpandasで読んでプロットするCSVファイルがたくさんあります。

ファイル (またはファイルに関するデータ) に関する情報をプロットに追加するために、ヘッダーを分析して、そこからさまざまなもの (測定ポイントの場所、測定の種類など) を抽出しています。

問題は、ファイルがドイツ語であるため、多くのウムラウト (ü、ö、ä) が含まれていることです。今、私はそれらを完全に読んで理解できますが、私のスクリプトはできません。

u'Ümlautstring'したがって、それらを有効な 2 文字表現 (ü=ue など) に単純に置き換えて、または\xfcstringPython での使用について心配する必要がないようにします。

Googleによると、トリックを行う必要がありますが、機能しません。

さらに調査したところ、問題は見つかりましたが、解決策はありません。

私の csv ファイルは でエンコードされていますがISO 8859-15、私のlocaleは ですLANG=de_DE.UTF-8。これは、私が理解している限り、sed がüISO 8859-15 では見つからない utf 8 形式で検索することを意味します。

では、ウムラウトを見つけるために sed に何を伝えなければなりませんか?

私がこれまでに見つけたもののほとんどは Perl を示唆していますが、それは実際にはオプションではありません。