問題タブ [cp1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
macos - RTF CP1252 からテキスト UTF-8 へ
これは、MAC OSX zshell でプレーン テキストに変換する必要があるファイルです。 http://narod.ru/disk/6431540001/Test_rtf.rtf.html
unrtf、rtf2txt、rtf2html = 結果なしを試しました。ru_cp1252 を変換できません。また、私は試しました
unrtf ファイル.rtf | iconv -f cp1252 -t UTF-8 結果はありません。
どんな解決策にも満足します: shell/perl/python/ruby
ファイルをダウンロードしたくない場合は、cat を使用して zshell で表示される rtf ファイルの一部があります。
java - JavaでCP1252エンコーディングを使用してInputsteamをデコードします
ExtJSを介してPOSTリクエストから受け取るInputstreamは、CP1252エンコーディングです。Json文字列を使用して適切なJavaBeanに変換できるように、Inputsteamをデコードするにはどうすればよいですか。
InputStreamReaderのgetEncoding()メソッドを使用してエンコーディングを見つけました。
ExtJsは次の形式でデータを送信します。
次のように変換する必要があります:
java - Excelスプレッドシートでの文字エンコード(およびそれをデコードするために使用するJava文字セット)
JExcelライブラリを使用してExcelスプレッドシートを読み取っています。スプレッドシートの各セルには、44言語(英語、ポルトガル語、フランス語、中国語など)のローカリゼーション文字列を含めることができます。今日、私はAPIが使用することになっているエンコーディングに関して何も伝えません。中国語はOKですが、ポルトガル語とドイツ語は常に台無しになります。どういうわけか、デフォルトのエンコーディング(私の開発ボックスではMacRoman、本番環境ではUTF-8)は、Excelワークブックから取得した文字列を適切に解釈できません。JExcelがファイルの文字エンコードを解釈する方法に何か問題があるはずです。
そうは言っても...
Excelブックのすべての文字列は、同じ文字セットでエンコードされていますか?
この文字セットが何であるかを尋ねることができるワークブックのメタデータはありますか(まだ見つけていません)?
すべてのセルをjchardet(http://jchardet.sourceforge.net/)のようなものに通すと、ワークブック全体の文字エンコードを理解できる可能性があります(これは、最初の質問が「はい、特定のワークブックのすべての刺し傷は同じ文字セットでエンコードされています ")?
非常に多くの質問、非常に少ない時間。
python - cp1252 でエンコードされた文字のバイナリ表現
Windows の cp1252 文字ライブラリ内にカプセル化された文字 (例: •、†、…など) のバイナリ表現はどこにありますか?
java - Javaで文字列をWindows文字セットからUTF 8に変換する
そのため、.bat ファイルから呼び出される Java アプリにいくつかの引数を与える必要があります。これを行うと、引数がシステムの文字セット エンコーディングを持つようになり、一部の文字が正しく表示されなくなります。私はこれを試しました
このリストhttp://docs.oracle.com/javase/1.4.2/docs/guide/intl/encoding.doc.htmlから他のいくつかを試してみましたが、どれも成功しませんでした。Windows charset から Java の UTF 8 に文字列をエンコードするには、他にどのようにすればよいですか? よろしくお願いします!
よろしく、ロドリゴ。
編集: .bat で指定した引数は Martín であり、出力 (JLabel 表示) はこの Martín を示しています。
utf-8 - Windowsでcp1252をutf-8に一括変換
そのため、オンラインで見つけたヒントと trix を使用して、Windows で大きな Java ソース ツリーを cp1252 から UTF-8 に変換しようとしました。問題は、私が Windows を使用していることです。私は VB をしません。-oCygwin の iconv は切り替えを行いません。
私が最初に使用しようとした行は次のとおりです。
{}.convertedこれにより、作業ディレクトリにファイルが作成され、2 つ目-execは明らかな理由で失敗します。
iconv 式を引用符で囲みます。
次のエラーが発生します。
ただし、個々の式を手動で実行すると完全に機能します。
ランダムな引用を試してみましたが、何もうまくいかないようです。何が欠けていますか? なぜうまくいかないのでしょうか..?
前もって感謝します、ラース
java - Javaで文字セットを検出する方法は?
半年前、私は厄介な問題に直面しました。そして、それでもそれを修正することができませんでした。問題はlog4j-loggingにあり、デフォルトの文字セットはutf8です。
時々私は異なるエンコーディング、CP1252でメッセージを受信します。(これを変更する方法はありません)。したがって、utf8にログインすると、テキストが読み取れなくなります。なんとかしてエンコーディングを修正することができ、このテキストはログで読み取ることができます。
しかし、その「エンコーディング修正」を通常のメッセージに適用すると、混乱します。その変換が本当に必要かどうかを知る必要があります。残念ながら、私には考えがありません。
encoding - HEX-UTF-8ファイルを編集します
HEX-Editorを使用してUTF-8/no-BOMファイルを作成しようとしています。e2 82 ae私が望むUTF文字は、 UTF-8にあるTUGRIKSIGNです。
N++でUTF-8/no BOMファイルを作成し、N ++で文字をコピーして、ファイルを保存しました。Voilà、HEX-Editorで見栄えがする、ファンシーe2 82 ae!
そこで、逆に3バイトe2 82 aeをwxHexEdtiorでファイルに保存してみました。Crap、N ++は、何らかの理由でファイルがANSI(Latin1)でエンコードされていると考えています。
まったくわかりません。Windows -CP1252-エンコーディングとの衝突がある可能性がありますか?
もう1つの興味深い点(私もまったく取得していません)は、wxHexEditorがファイルの分解を表示することです。
N ++で作成されたファイルの逆アセンブリはwxHexEditorで問題ありませんが、wxHexEditorで作成されたファイルの逆アセンブリは無効です。
誰かがその黒魔術を私に説明してくれたら本当に嬉しいです。


pdf - CP1252の標準PDFフォントのAdobeFontMetrics
14の標準PDFフォントのメトリックが必要です。
アドビから以下をダウンロードしましたが、CP1252ではなくISO-8859-1エンコーディングを使用しているようです: https ://partners.adobe.com/public/developer/en/pdf/Core14_AFMs.zip
したがって、コードポイント127から142(たとえば、省略記号)が欠落しています。
これらのType1フォントのCP1252バージョンはどこでダウンロードできますか?ありがとう。
bash - Cygwin端末で特定の文字が表示されない?
wgetパッケージを追加して、ストックCygwinインストールを実行しています。
コマンドを実行すると
私はこれを取得します。文字の誤った表示に注意してください
ファイルをダウンロードしただけでは、メモ帳ではすべて問題なく表示されます。