問題タブ [cp1252]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1094 参照

macos - RTF CP1252 からテキスト UTF-8 へ

これは、MAC OSX zshell でプレーン テキストに変換する必要があるファイルです。 http://narod.ru/disk/6431540001/Test_rtf.rtf.html

unrtf、rtf2txt、rtf2html = 結果なしを試しました。ru_cp1252 を変換できません。また、私は試しました

unrtf ファイル.rtf | iconv -f cp1252 -t UTF-8 結果はありません。

どんな解決策にも満足します: shell/perl/python/ruby

ファイルをダウンロードしたくない場合は、cat を使用して zshell で表示される rtf ファイルの一部があります。

0 投票する
1 に答える
1061 参照

java - JavaでCP1252エンコーディングを使用してInputsteamをデコードします

ExtJSを介してPOSTリクエストから受け取るInputstreamは、CP1252エンコーディングです。Json文字列を使用して適切なJavaBeanに変換できるように、Inputsteamをデコードするにはどうすればよいですか。

InputStreamReaderのgetEncoding()メソッドを使用してエンコーディングを見つけました。

ExtJsは次の形式でデータを送信します。

次のように変換する必要があります:

0 投票する
2 に答える
30477 参照

java - Excelスプレッドシートでの文字エンコード(およびそれをデコードするために使用するJava文字セット)

JExcelライブラリを使用してExcelスプレッドシートを読み取っています。スプレッドシートの各セルには、44言語(英語、ポルトガル語、フランス語、中国語など)のローカリゼーション文字列を含めることができます。今日、私はAPIが使用することになっているエンコーディングに関して何も伝えません。中国語はOKですが、ポルトガル語とドイツ語は常に台無しになります。どういうわけか、デフォルトのエンコーディング(私の開発ボックスではMacRoman、本番環境ではUTF-8)は、Excelワークブックから取得した文字列を適切に解釈できません。JExcelがファイルの文字エンコードを解釈する方法に何か問題があるはずです。

そうは言っても...

Excelブックのすべての文字列は、同じ文字セットでエンコードされていますか?

この文字セットが何であるかを尋ねることができるワークブックのメタデータはありますか(まだ見つけていません)?

すべてのセルをjchardet(http://jchardet.sourceforge.net/)のようなものに通すと、ワークブック全体の文字エンコードを理解できる可能性があります(これは、最初の質問が「はい、特定のワークブックのすべての刺し傷は同じ文字セットでエンコードされています ")?

非常に多くの質問、非常に少ない時間。

0 投票する
1 に答える
286 参照

python - cp1252 でエンコードされた文字のバイナリ表現

Windows の cp1252 文字ライブラリ内にカプセル化された文字 (例: •、†、…など) のバイナリ表現はどこにありますか?

0 投票する
1 に答える
5988 参照

java - Javaで文字列をWindows文字セットからUTF 8に変換する

そのため、.bat ファイルから呼び出される Java アプリにいくつかの引数を与える必要があります。これを行うと、引数がシステムの文字セット エンコーディングを持つようになり、一部の文字が正しく表示されなくなります。私はこれを試しました

このリストhttp://docs.oracle.com/javase/1.4.2/docs/guide/intl/encoding.doc.htmlから他のいくつかを試してみましたが、どれも成功しませんでした。Windows charset から Java の UTF 8 に文字列をエンコードするには、他にどのようにすればよいですか? よろしくお願いします!

よろしく、ロドリゴ。

編集: .bat で指定した引数は Martín であり、出力 (JLabel 表示) はこの Martín を示しています。

0 投票する
4 に答える
4175 参照

utf-8 - Windowsでcp1252をutf-8に一括変換

そのため、オンラインで見つけたヒントと trix を使用して、Windows で大きな Java ソース ツリーを cp1252 から UTF-8 に変換しようとしまし。問題は、私が Windows を使用していることです。私は VB をしません。-oCygwin の iconv は切り替えを行いません。

私が最初に使用しようとした行は次のとおりです。

{}.convertedこれにより、作業ディレクトリにファイルが作成され、2 つ目-execは明らかな理由で失敗します。

iconv 式を引用符で囲みます。

次のエラーが発生します。

ただし、個々の式を手動で実行すると完全に機能します。

ランダムな引用を試してみましたが、何もうまくいかないようです。何が欠けていますか? なぜうまくいかないのでしょうか..?

前もって感謝します、ラース

0 投票する
2 に答える
3661 参照

java - Javaで文字セットを検出する方法は?

半年前、私は厄介な問題に直面しました。そして、それでもそれを修正することができませんでした。問題はlog4j-loggingにあり、デフォルトの文字セットはutf8です。

時々私は異なるエンコーディング、CP1252でメッセージを受信します。(これを変更する方法はありません)。したがって、utf8にログインすると、テキストが読み取れなくなります。なんとかしてエンコーディングを修正することができ、このテキストはログで読み取ることができます。

しかし、その「エンコーディング修正」を通常のメッセージに適用すると、混乱します。その変換が本当に必要かどうかを知る必要があります。残念ながら、私には考えがありません。

0 投票する
1 に答える
5166 参照

encoding - HEX-UTF-8ファイルを編集します

HEX-Editorを使用してUTF-8/no-BOMファイルを作成しようとしています。e2 82 ae私が望むUTF文字は、 UTF-8にあるTUGRIKSIGNです。

N++でUTF-8/no BOMファイルを作成し、N ++で文字をコピーして、ファイルを保存しました。Voilà、HEX-Editorで見栄えがする、ファンシーe2 82 ae

そこで、逆に3バイトe2 82 aeをwxHexEdtiorでファイルに保存してみました。Crap、N ++は、何らかの理由でファイルがANSI(Latin1)でエンコードされていると考えています。

まったくわかりません。Windows -CP1252-エンコーディングとの衝突がある可能性がありますか?

もう1つの興味深い点(私もまったく取得していません)は、wxHexEditorがファイルの分解を表示することです。

N ++で作成されたファイルの逆アセンブリはwxHexEditorで問題ありませんが、wxHexEditorで作成されたファイルの逆アセンブリは無効です。

誰かがその黒魔術を私に説明してくれたら本当に嬉しいです。

画像1

画像2

0 投票する
1 に答える
2690 参照

pdf - CP1252の標準PDFフォントのAdobeFontMetrics

14の標準PDFフォントのメトリックが必要です。

アドビから以下をダウンロードしましたが、CP1252ではなくISO-8859-1エンコーディングを使用しているようです: https ://partners.adobe.com/public/developer/en/pdf/Core14_AFMs.zip

したがって、コードポイント127から142(たとえば、省略記号)が欠落しています。

これらのType1フォントのCP1252バージョンはどこでダウンロードできますか?ありがとう。

0 投票する
2 に答える
5379 参照

bash - Cygwin端末で特定の文字が表示されない?

wgetパッケージを追加して、ストックCygwinインストールを実行しています。

コマンドを実行すると

私はこれを取得します。文字の誤った表示に注意してください

ファイルをダウンロードしただけでは、メモ帳ではすべて問題なく表示されます。