問題タブ [windows-1252]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java Windows-1252 間違った文字
VisualBasic Web サービスに送信する文字列を暗号化する RSA アルゴリズムをコーディングしています。残念ながら、VB RSAcryptoserviceprovider は常に「Bad data」という例外を返します。これはエンコードに問題があります。VisualBasic コードは文字列を受け取り、windows-1252 エンコーディングを使用してバイト配列に変換し、復号化します。
私のJavaコードでは、これを使用して暗号化しています:
暗号化された文字列を「system.out.print」すると、�のような奇妙な文字が表示されます。Windows-1252エンコーディングが間違っているということですか?ここで何が間違っていますか?変更できるのは Java コードのみであり、VB は変更できないことに注意してください。
ありがとうございました!
utf-8 - Windows-1252 と UTF-8 エンコーディングの間の変換について混乱している
照合順序が windows-1252 に設定されていると主張する従来のデータベースがあり、テキスト フィールドの内容を次のように保存しています。
I’d
従来の Web アプリで表示するI’d
と、ブラウザーと同じように表示されます。ブラウザは、UTF-8 のページ エンコーディングを報告します。その変換がどのように行われたかわかりません (オンザフライの検索と置換によるものではないことはほぼ確実です)。これは私にとって問題です。なぜなら、テキスト フィールド (および他の多くの同様のフィールド) を従来のデータベースから新しい UTF-8 データベースに取り込んでいるからです。新しい Web アプリは、新しいデータベースからのテキストを次のように表示します。
I’d
として表示したいと思いI’d
ます。I’d
レガシ アプリがこれをどのように達成できたのかわかりません (Ruby をいじっても、文字列をに変換する方法がわかりませんでしたI’d
)。
私はここのどこかで自分自身を結び目にしました。
winforms - System::String をエンコードして、Windows-1252 エンコーディングでテキストを表示する方法は?
serialPort コンポーネントを含む Windows フォームがあり、DataReceived イベント ハンドラーを使用して受信バッファー内のデータを処理します。String^ を返す ReadExisting メソッドを使用します。これは、受信バッファー内のすべてのデータを欠落させることなく収集できる最も信頼できる方法だからです。そのようです:
問題は、ReadExisting() メソッドによって返される String^ 値にあります。「wêyÿØÿþÿý6」のような文字を入力すると、127 未満の 10 進値の文字のみが表示されるため、端末から「w?y??????6」を読み取ります。
私が望むのは、ReadExisting() メソッドによって返される String^ 値を Windows-1252 エンコード形式でエンコードして、127 ~ 255 の値を持つ文字を識別できるようにすることです。StreamWriter の Write() メソッドを使用してテキスト ファイルに書き込むことができるように、String^ 変数にする必要があります。
検索してみましたが、これは私がやりたいことに似ていることがわかりました。だからここに私がしたことがあります:
String^ converted
次に、SerialPort と StreamWriterに書き込みます。それでも、無駄に。出力はまだ同じです。127 を超える文字は、引き続き「?」として表されます。これを行う適切な方法は何ですか?私のやり方に何か問題があるのかもしれません。
java - Windows-1252 ファイルを UTF-8 ファイルに変換する
こんにちは、この単純な変換タスクで問題が発生しています。これが私のコードです(ラフですがそれほど複雑ではありません):
しかし、同じエンコード形式で入力と同じ出力が得られます。とにかく助けることができると思いますか?
java - Windows-1252 でファイルを読み書きする
ドイツ語の文字を含むファイルをディスクに書き込んで、Windows-1252
エンコーディングを使用して読み取ろうとしています。理由はわかりませんが、出力は次のようになります。
何かご意見は?これが私のコードです。これを実行するには、spring-core と commons-io が必要です。
linux - Windows から UTF-8 への文字エンコード動作クエリ
UTF-8 で Windows-1252 文字をコンパイルするときの予期される動作に関する簡単なクエリ。Java ソース コードで Ant タスクを使用してビルドすると、奇妙な文字エンコーディングが発生するようです。
たとえば、Windows マシンでは通常 \u2013 としてエンコードされる特定のフィールド文字は、Linux では \226 に変換されます。\226の説明は?たとえば、ブラウザで正しくレンダリングされますか?
clojure - 文字列のエンコードを変換
Windows-1252 エンコーディングの文字列がありますが、UTF-8 に変換する必要があります。
これは、 quoted-printable Windows-1252でエンコードされたロシア語のテキストを含むフィールドを持つ UTF-8 ファイルを修正するプログラム用です。quoted-printableをデコードするコードは次のとおりです。
最終的なコードは次のとおりです。
(String. ... "Encoding")
これは、quoted-printable-encoded 文字のすべての連続実行で使用するエンコーディングを修正します。元の関数はペアをデコードしようとしていたため=3D
、 の引用された印刷可能なエンティティであるなどをスキップし=
ます。
c++ - Rcpp を使用して Windows-1252 ファイルを読み取るにはどうすればよいですか?
ファイルを Rcpp と共に Windows-1252 エンコーディングに読み込むときに、入力形式を強制したい。Linux/Windows 環境を切り替え、ファイルが一貫して 1252 エンコーディングであるため、これが必要です。
これを機能させるにはどうすればよいですか:
上記は次の場合に失敗します。
また、システムのデフォルトである「Swedish_Sweden.1252」を試してみましたが、役に立ちませんでした。試してみまし#include <boost/locale.hpp>
たが、Rcpp (v 0.12.0)/BH boost (v. 1.58.0-1) では利用できないようです。
アップデート:
これをもう少し深く掘り下げた後、RTools (v. 3.3) の gcc (v. 4.6.3) がロケールをサポートして構築されているかどうかはわかりません。この SO の質問はその可能性を示しています。"" または "C" 以外の引数が std::locale() で機能する場合、それを知ることは興味深いでしょう。さらにいくつかの代替手段を試しましたが、何も機能しないようです。
フォールバック ソリューション
私は完全に満足しているわけではありませんが、base::iconv()
修正を使用すると、元の形式に関係なく、文字に関する問題が修正されたようです。これは、文字を正しい形式で解釈することを強制する引数のおかげですfrom="WINDOWS-1252"
。つまり、Rcpp にとどまりたい場合は、単純に行う:
C++ から関数を取得してそこから呼び出すよりも、R で関数をラップする方が望ましいことに注意してください。コードが少なくて済み、パフォーマンスが 2 倍向上します (マイクロベンチマークで確認)。
javascript - Javascript が Windows-1252 エンコーディングを UTF-8 に変換する
以下の文字列を変換するにはどうすればよいですか。
javascript を UTF-8 に使用すると、次のように%E8
なり%C3%A8
ます。
理由は、このキャラクターがつまずいているように見えるからですdecodeURIComponent
文字列をhttp://meyerweb.com/eric/tools/dencoder/にドロップして、次のようなコンソール エラーを確認することでテストできます。Uncaught URIError: URI malformed
私は特に、htmlドキュメント全体をデコードできるものを探しています。これは、この文字がUTF-8に由来すると思われるwindows-1252
エンコードされていると主張しています。%E8
ありがとう!