問題タブ [codepages]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
encoding - ファイルの文字エンコーディングを修正するにはどうすればよいですか?
ANSI でサポートされていないアクセント付きの文字が含まれているため、ANSI としてエンコードされるべきではない ANSI でエンコードされたテキスト ファイルがあります。私はむしろUTF-8で作業したいと思います。
データは正しくデコードできますか、それともトランスコーディングで失われますか?
どのようなツールを使用できますか?
ここに私が持っているもののサンプルがあります:
文脈から (café は café である必要があります)、これらは次の 2 つの文字であることがわかります。
c++ - WideCharToMultiByte を正しく使用するにはどうすればよいですか
WideCharToMultiByteに関するドキュメントを読みましたが、このパラメーターにこだわっています。
変数を適切に初期化して関数にフィードする方法がよくわかりません
encoding - コードページとエンコーディング
これについてGoogle検索を行うことを誰かが勧める前に、私は持っています。コードページとエンコーディングについてもう少し明確にする必要があります。
UTF8 エンコーディングを使用し、イタリア語のコード ページを使用してからフランス語のコード ページを使用すると、バイトが変更されていなくても、異なる文字が取得されるということですか?
php - PHP、MSSQL2005、およびコードページ
MSSQL2005 データベースにアクセスし、そこからデータを読み取り、結果をメールで送信する php スクリプトがあります。
一部の列名とフィールド自体の両方に特殊文字が含まれています。
ブラウザー (Web サーバー iis) を介してスクリプトにアクセスすると、クエリが正しく実行され、メールの内容が (対象ユーザーに対して) 正しくエンコードされます。ただし、コンソールから php を実行すると、クエリが失敗します (列名に特殊文字が含まれているため)。クエリ内の特殊文字を chr() の呼び出しと latin-1 の文字コードに置き換えると、クエリは正しく実行されますが、結果も latin-1 でエンコードされるため、メールに正しく表示されません。PHP/MSSQL ドライバー/… が 2 つのシナリオで異なるエンコーディングを使用しているのはなぜですか? それを回避する方法はありますか?
ご存じのように、SQLAgent (または taskmanager など) を使用してスクリプトをスケジュールしたいので、コンソールが必要です。
unicode - どのコードページを見ているのかを知るにはどうすればよいですか?
テキストを送信する方法に関するドキュメントを備えたデバイスがあります。0x00-0x7F を使用して、アクセント付き文字、ユーロ記号などの「特殊」文字を送信します...
彼らは既存のコード ページをコピーしていくつかの変更を加えたと推測していますが、どのコード ページが私のドキュメントのコード ページに最も近いかを特定する方法がわかりません。
理論的には、これは簡単に実行できるはずです。たとえば、Á を 0x41 にマップするので、すべてのコード ページを調べて、この文字がその位置にあるコード ページを見つける方法を見つけることができれば、簡単なことです。
ただし、インターネットで見つけられるのは、私が見ているのと同じようなコード ページ ダンプへのリンク、またはヒューリスティックを使用してテキストを読み取り、最も可能性の高いコード ページを推測するソフトウェアだけです。確かに誰かが見ているコードページを調べることを可能にしましたか?
unicode - コードソースをコードページから UTF-8 に変換するツール?
私はオープンソースプロジェクトに取り組んでいます。元のプロジェクトにはロシア語のコメントが含まれており、コードページ 1251 を使用しています。コードページ 1252 を使用していますが、ロシア語のコメントが Visual Studio Express 2008 で正しく表示されません。コードページ 950 (繁体字中国語) を使用している誰かがプロジェクトをコンパイルしようとしましたが、コード ページが原因で実行できませんでした! 今は本当に迷惑です。
コード ソースのファイル形式として unicode (より正確には署名付きの UTF-8) を使用するのがよい方法だと思います。
問題: ソースコード全体を簡単に変換するには?
私はすでに次のことを考えています:
Visual Studio でソース コードを UTF-8 として保存します。しかし: 私のコンピューターはコードページ 1252 を使用していますが、変換が正しく行われないように、元のコード ソースがコードページ 1251 を使用していることを VS に伝える方法が見つかりませんでした。
編集:「LicenseQ」で指摘されているように、VS で単一のファイルを別のエンコードで開く方法があります。開くダイアログの [開く] ボタンの近くにある矢印をクリックし、[開く] を選択してから、[コード エディター (エンコードあり)] を選択します。
もちろん、変換時にコンピューターのコードページを変更することもできます。しかし、これは Windows のグローバル設定であり、コンピューターを再起動する必要があるため、より使いやすい解決策を探しています。
私が必要としているものを正確に実行するCodePageConverterというツールを見つけましたが、バッチジョブとしては実行できません。
コードページから UTF-8 に変換する別のツール (コマンド ライン ツールが最適) を知っている人はいますか?
編集: tkotitan が示唆しているように、 iconvは私が探していたソリューションのようです。iconv の Windows バージョンがあります。そして、このツールの名前がわかったので、同様の問題を扱っているスタックオーバーフローの投稿を見つけることができました。
delphi - コードページ0とは何ですか?
Delphi関数を使用しています
COM関数(Acrobat Annotation getContents-他の投稿を参照)によって返される文字列で呼び出し、0を返します。
0とは何ですか?アンシ?
java - コードページ 1252 (Windows) から Java への変換 (Java で)
Windows 1252 コードページにあると思われる Java (元は Excel シートから) の文字列がいくつかあります。それらをJava独自のUnicode形式に変換してほしい。問題が発生した場合に備えて、ExcelファイルはJXLパッケージを使用して解析されました。
はっきりさせておきますが、明らかに、Excel ファイルから取得した文字列は、すでにある種の Unicode であるかのように見えます。
これは、コンテンツに何か Unicode が含まれているように見える場所です。 åäö はマルチバイト文字ですが、ASCII は通常のシングルバイト文字です。これは間違いなく Latin1 ではありません。printLn を使用して「contents」文字列を出力し、hello.txt ファイルにリダイレクトすると、文字「ö」が 2 バイト (16 進数では C3 B6) で表されていることがわかります。(10 進数で 195 と 179。)
[編集]
以下に示すさまざまなコードページなどで提案を試み、Cp1252などから変換しようとしました。代わりに他の種類の意味不明なものが得られるため、何らかの変換がありました。参照として、端末や書体などに問題がないことを確認するために、ソースコードに手動でコード化された「ö」文字列を常に出力しました。手動で入力した「ö」は常に機能しました。
[編集]
コメントで提案されているように WorkBookSettings も試しましたが、JXL のコードを調べたところ、コードの解析によって characterSet が無視されるようです。解析コードは、XLS ファイルが想定されているエンコーディングを調べるだけだと思います。
vb.net - コードページの値
1252とは別に、vb.netのgetencoding()で使用できる他のコードページ値は何ですか?
System.Text.Encoding.GetEncoding(1252).Getstring()
character-encoding - ANSI形式とは何ですか?
ANSI エンコーディング形式とは何ですか? システムのデフォルト形式ですか?ASCII との違いは何ですか?