問題タブ [cp1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java-ANDROID を使用して UTF 文字列を ANSI に変換し、ExternalSD で ANSI テキスト ファイルを作成する方法
ユーザーの回答を取得してファイルに保存するために、JavaでAndroidアプリを作成しました。問題は、このファイルが utf-8 で保存されていることです。エンド ユーザーは、ANSI (windows-1252) でのみファイルを読み取ることができる Windows 用アプリケーションである IBM SPSS でこれらのファイルを開きます。
java-androidアプリからSDカードに保存するANSIコードでファイルを作成するにはどうすればよいですか?
文字列をANSIに変換するには、次を使用する必要があることを知っていると思います。
あれは正しいですか?
ファイルを保存するための私のコードは次のとおりです。
「textBody」は ANSI に変換する文字列で、「interviewFile」も ANSI で保存するファイルです。
助けてくれてありがとう!!
java - cp-1252 を utf-8 としてエンコードしますか?
Linux サーバー上で実行されるが、cp-1252 を文字セットとして使用して従来の Windows マシンで生成されたファイルを処理する Java アプリを作成しようとしています。これらのファイルを、生成された cp-1252 ではなく utf-8 としてエンコードする方法はありますか?
java - Javaに正しい文字セットを使用させる方法は?
サーバーはCentOSで実行されており、JavaバックエンドはCP-1252を使用して(クライアントの1つによって)Windowsマシンで元々生成されたファイルを処理する必要がある場合がありますが、95%以上のユースケースで処理していますUTF-8ファイル。
私の質問:特定のファイルが常にUTF-8であり、他のファイルが常にCP-1252であることがわかっている場合、各ファイルの読み取りに使用する文字セットをJavaで指定することはできますか?もしそうなら:
- CentOSにCP-1252を追加するには、システムレベルで何かを行う必要がありますか?もしそうなら、これは何を含みますか?
- ファイルごとに正しいエンコーディングを適用するために、どのJavaオブジェクトを使用しますか?
前もって感謝します!
java - 「ç」などの文字を文字として認識するにはどうすればよいですか?
文を含むバイトの配列があります。この文の小文字を大文字に変換する必要があります。これが私がした関数です:
「コップ一杯の水」のような文でうまく機能します。問題は、「ç、á、é、í、ó、ú」などを含むすべてのANSI文字で機能する必要があることです。Character.isLetterメソッドはこれらの文字では機能しないため、大文字に変換されません。
これらのANSI文字をJavaで文字として識別する方法を知っていますか?
編集
誰かが知りたければ、私は答えの後にもう一度メソッドを実行しました、そして今それはこのように見えます:
java - Java で Cp1250 を使用してファイルを作成する
Cp1250文字セットを使用してファイルを作成しようとしています:
ただし、juniversalchardetで実際の文字セットを検出すると、 Cp1252であるWINDOWS-1252と表示されます( javadocによると)。
Enca( enca -L czech -g filename
) はISO-8859-2を検出します。
Cp1250を正確に設定するにはどうすればよいですか(または、 java.nio API 名を使用してwindows-1250 )?
ありがとうございました
カレル
html - IE で後方ナビゲーションを行うと、html 属性値がスマートな二重引用符で囲まれるのはなぜですか?
私のページはすべてのブラウザーで毎回正常に読み込まれますが、ブラウザーの [戻る] ボタンを使用すると、オプション要素の値属性に使用される二重引用符がストレートのものではなくスマートな二重引用符に変更される IE を除きます。
真っ直ぐな二重引用符で最初に正しくロードします。
IE9 ブラウザーでは、スマートな二重引用符が返されます。
次に、javascript で値を取得すると、""500"" のようになり
ます。そして、なぜ後方ナビゲーションでのみそれを行うのですか?
トラブルシューティング
以下を定義しても解決しませんでした:
上記のhtmlオプション要素は、レンダリング前に変更されるjquery select要素の一部であるため、すべての外部スクリプトに文字セットを追加しませんでした。
追加情報:
文字は ANSI Windows Code Page 1252 からのものです。
- 文字: コードポイント: WINDOWS-1252
- 「 : U+201C : 93
- 」 : U+201D : 94
java - Why does Eclipse use Cp1252 encoding?
Apologies if this is a very amateurish question! I know Eclipse uses Cp1252 as the default for its encoding.
I recently created a program using hash maps to convert letters input to Braille. To do this, I had to change the encoding method to UTF-8.
I know very little about either, but everything I've read indicates UTF-8 can represent every character in Unicode and has a much bigger library of recognised symbols.
Why then is it not the preferred encoding style for Eclipse?
java - Eclipse:テキストエディタでUTF-8エンコーディングを使用すると、文字列が正しく機能しなくなりますが、どうすれば修正できますか?
コードにギリシャ語のコメントがいくつかあります。ギリシャ文字を入力すると、「SaveusUTF-8」と表示されます。
次に、そうしてプログラムを再実行すると、以前に表示された文字列が正しく機能しなくなります。
たとえば、私は暗号化アルゴリズム(Simplified Des)に取り組んでおり、これはテキストエディターのCp1252エンコーディングで出力として得られるものです。
最初の行は暗号化されたバージョンで、2番目の行は復号化されたバージョンです。これは、エンコーディングをUTF-8に変更したときに取得するものです。
私はここで何が起こっているのか分かりません、私はこれまでこのようなものを見たことがありません。誰かが私を助けることができますか?前もって感謝します
java - Simplified DESの実装がCp1252エンコーディングでは正常に機能するのに、UTF-8では機能しないのはなぜですか?
昨日、次の質問をしましたが、実際の問題の詳細が記載されていなかったため、あまり注目されませんでした。
Eclipse:テキストエディタでUTF-8エンコーディングを使用すると、文字列が正しく機能しなくなりますが、どうすれば修正できますか?
何が起こっているのかを明確に理解できるように、問題を可能な限り分析するように努めます。
私は、教育目的でSimplifiedDESアルゴリズムを実装することになっている大学のプロジェクトを持っています。このアルゴリズムは、8ビットデータを暗号化するために10ビットキーを使用する暗号化アルゴリズムです。
実装では、任意の文字列の暗号化を含めたいと思いました。
だから私は8ビットの暗号化のためのコードを書きました、そしてそれはすべての種類の入力のために完全にうまくいきました。文字列暗号化のサポートを含めるために、関数を使用してString.getBytes()
、文字列のすべてのバイトを変数内に保存しましたbyte[] data
そして、私はこの論理に従いました:
復号化のために、私はこのロジックに従いました。
main
これが関数の実際のコードです
Cp1252であるデフォルトのエンコーディングを使用する。文字列を暗号化しようとすると、次の結果が得られました。
データを暗号化および復号化するたびに実際のビット表現を確認するために、各文字列のすべてのデータを表示するために次の関数を作成しました。
だから私は次の結果を得ました:
すべてが期待どおりに機能しているようです。ただし、コードエディタでギリシャ文字をサポートするには、エンコーディングをUTF-8に変更する必要がありました。
すべてを再度実行した後、次の結果が得られました。
復号化されたテキストの一部の単語が正しく表示されていることに注目してください。たとえばNFO
、BOB
。EclipseがUTF-8のルールに従ったビットのシーケンスを認識しないかのように、ビット操作に何らかの問題があるように私には思えます。
バイナリ形式の結果は次のとおりです。
今、私は問題の鉱石をはっきりと見ることができます。UTF-8が文字列にさらにバイトを追加しているようです。しかし、理由はわかりません。つまり、初期テキストのバイト数は同じように見えるのに、なぜこれらのバイトが暗号化後に追加され、復号化後にさらに追加されるのでしょうか。
何か助けていただければ幸いです。前もって感謝します!
mysql - mysql to Excel - 間違った文字セット出力
サーバー: RHEL 5.5、2.6.18-194.el5、MySQL 5.0.77
クライアント: Win 7 Corporate x86、MS Excel 2010、MySQL ODBC 5.2w ドライバー
サーバー上に mysql basetest
があり、 table がありますrr
。insert.sh が起動されるたびに切り捨てられtest
ます。rr
新しい値を書き込みます。私が必要としているのは、このデータを取得するためのエクセルです。
したがって、ODBC ドライバーを選択してベースに接続すると、すべてが正常に機能し、値は Excel の列に書き込まれますが、キリル文字を使用しない場合にのみ (実際に使用する必要があります)。すると、出力は「ровалоÑьп」のようになります。これはUTF-8→CP1252かな。
したがって、私の推測では、Excel は cp1252 のみを使用しています。db を削除して、CHARACTER SET latin1 で再度作成しようとしました (これは cp 1252 の mysql 名ですよね?)。その後、テーブルで同じことを行いましたが、それでも同じ出力が得られます。
また、MySQL コネクタの文字セットを latin1 に変更しましたが、まだうまくいきません。足りないものはありますか?