問題タブ [codepages]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
2042 参照

python - Python を使用して特定のロケール/コードページで Windows コマンド (ipconfig、netstat) を実行する方法

Pythonを使用して、、、などipconfigのWindowsコマンドの出力を解析したい。netstattasklist

ただし、これらのコマンドの出力の特定の部分 (固定) は、現在のロケール/コードページに基づいて返されます。

たとえば、ipconfig出力で

またはコードページに応じて他の言語で。

os.popen("ipconfig")特定のロケール/コードページ設定などでコマンドを実行する方法はありますか?

  1. locale module: locale.setlocale(locale.LC_ALL,"american_united states") locale.getlocale()returnsを使用してみ"English_United States.1252" ましたが、os.system("chcp")それでも古い codepage:936os.popen("ifconfig")返し、文字列を中国語で返します。

  2. os.system("chcp 65001") 英語の文字列を返すようos.popen("ifconfig")になりましたが、コンソールからの以前の出力がすべてクリアされます (新しいコンソールが開く可能性があります)。これは受け入れられません。

os.popen("ipconfig")特定のロケール/コードページ設定などでコマンドを実行する方法はありますか? どんな助けでも大歓迎です。

0 投票する
3 に答える
2192 参照

c# - C# で char のコードページ 850 のインデックスを特定するにはどうすればよいですか?

コードページ 850 でエンコードされたテキスト ファイルがあります。このファイルを次のように読みます。

lineここで、コードページ 850 にあるその文字のゼロベースのインデックスの上のループ内の文字列内のすべての文字が必要です。次のようなものです。

これは可能で、どのようint GetIndexInCodepage850(char c)に見えるでしょうか?

0 投票する
1 に答える
1076 参照

c++ - 電子メール メッセージのおかしな ISO エンコーディングをデコードする

電子メールの本文 (POP3 経由で取得した char[] バッファ) があります。ISO コード ページのマークアップを使用しているようです。

としてエンコードされます

それを(読み取り可能な)CStringWに変えるために使用できる既製のものはありますか?

(環境: Win32、C++、VC2008)

0 投票する
3 に答える
1316 参照

c - Win32コマンドラインアプリケーションでargvをワイド文字に変換する方法は?

プログラムで C 用の win32 api を使用してシリアル ポートから読み取っていますが、これはかなり低レベルのもののようです。シリアル ポートから読み取るより良い方法がないと仮定すると、CreateFile 関数には LPCWSTR 引数が含まれます。私が読んだところ、LPCWSTR は wchar_t 型のようです。まず、wchar と char の違いがよくわかりません。ANSI と Unicode については読んだことがありますが、それが自分の状況にどのように当てはまるかはよくわかりません。

私のプログラムは wmain ではなく main 関数を使用しており、コマンド ラインから引数を取得して wchar_t 変数に格納する必要があります。その場で弦を作っただけなら、これができることがわかりました。

L が char 配列を wchar 配列に変換するように見えるためです。ただし、私が行うと機能しません。

明らかに構文エラーだからです。私の質問は、通常の文字列を wchar_t 文字列に変換する簡単な方法はありますか?

または、このUnicodeのものを完全に回避し、WindowsでCを使用して別の方法でシリアルから読み取る方法はありますか..

0 投票する
3 に答える
2818 参照

php - htmlentities シンボルのアラビア文字を変換するにはどうすればよいですか?

htmlentities シンボルのアラビア文字を変換する必要があります。コードページ: ISO-8859-1。

sk - これは例えばアラビア記号です。

戻り値:

このシンボルから html-entities を取得するにはどうすればよいسكですか?

0 投票する
4 に答える
2242 参照

localization - ライセンス ダイアログに表示される RTF ファイルの LGHT0311 エラー

pt-BR とコードページ 860 の .wxl ファイルを用意します。何らかの理由で、pt-PT と pt-BR の残りの wix UI に含まれる wxl ファイルはコードページ 1252 を使用しています。

エラー LGHT0311 : 指定されたデータベース コード ページ '1252' では使用できない文字を含む文字列が提供されました。
これらの文字をデータベースのコード ページに存在する文字に変更するか、次の属性のいずれかを変更してデータベースのコード ページを更新します
。Product/@Codepage、Module/@Codepage、Patch/@Codepage、PatchCreation/@Codepage、または WixLocalization/@Codepage。

エラー行は、rtf ファイルの内容を読み取る場所です。

Product/@Codepage="!(loc.CodePage)" を設定する提案を見つけましたが、3.5 ではその属性にローカライズを使用できないようです。

現時点では、ja-JP、zh-CN、es-ES を含む他の 12 の言語がすべて動作します。

私が解決しようとしているオプション:

  • pt または pt-BR の正しいコードページは 1 つありますか?
  • テキストのどの部分がコードページに含まれていないかを知る方法は? コードページ 860 または 1252 (いずれか適切な方) に基づいて、エラーのあるテキストを指摘するにはどうすればよいですか。
  • 毎回製品を再構築するのではなく、コードページを簡単に設定するにはどうすればよいですか?
  • 組み込みの wxl (およびコードページ) を使用せず、代わりに必要なものを使用するように wix に指示するにはどうすればよいですか?
0 投票する
6 に答える
36273 参照

cmd - CMD の CodePage を永久に変更しますか?

私の Windows cmd CodePage は現在 65001 未満です。Android の操作を行っていて、コンソール ログを使用する必要があるため、変更方法は忘れてください。

chcp 437 を使用して CodePage を元に戻すと、機能します。しかし、新しいコマンド ウィンドウを開始すると、元に戻ります。

それを恒久的にするためにchcpのことをする方法は?

0 投票する
1 に答える
969 参照

c++ - VS10 のデバッグ コンソールのデフォルト コード ページを変更する

現在、システム ロケールのデフォルトは 932 (日本語 Shift-JIS) ですが、デフォルトで 65001 (UTF-8) にしたいと考えています。

コードのどこかに SetConsoleOutputCP 行を挿入してから削除することで、特定のプログラムのデフォルトを変更できますが、すべてのプログラムに対してこれを行うのはかなり面倒です。

助言がありますか?

0 投票する
7 に答える
47615 参照

batch-file - アクセント付き文字を含む BAT/CMD ファイルの実行

パスにアクセント付き文字が含まれる場所で EXE ファイルを実行する命令を含む Windows バッチ ファイルがあります。バッチファイルの内容は次のとおりです。

C:\español\jre\bin\java.exe - このパスは存在し、適切です。このコマンドは、cmd.exe で直接実行できます。しかし、bat/cmd ファイルからコマンドを実行すると、「指定されたパスが見つかりません」というメッセージが表示されて失敗します。

これを修正する 1 つの方法は、コード ページを 1252 に設定することです (これは私にとって有効です)。しかし、英語以外のロケール用にコード ページを設定する必要があり、どのコード ページを使用するかを判断するのは非常に困難です。

この問題を解決する別の方法はありますか? 多分コマンドラインオプションか何か?

0 投票する
2 に答える
609 参照

windows - Windows ANSI Western (cp 1252) が最初に登場した Windows のバージョンは?

どのバージョンの Windows が Windows ANSI Western 文字エンコーディングを導入したかについて、できるだけ明確なリファレンスを提供したいと思います。

私の主な容疑者は、Windows 1.0 (常識) と Windows 3.1 です。

Windows 3.1 は、MSDN で入手できる Microsoft の本による暗示によって主張されました。Windows 95 で使用されるエンコーディングは、Windows 3.1 で導入されたと記載されています。それはあまりにも漠然としていて、いくつかの虚偽を暗示しているため (コードページ 437、元の IBM PC 文字セットなど)、決定的な参考文献や特に信頼できるものとは見なしません。


更新: http://iana.org/assignments/character-setsで、登録された IANA 名 "ISO-8859-1-Windows-3.0-Latin-1" および "ISO-8859-1-Windows-3.1-Latin" を見つけました-1」。「windows-1252」は後で登録されました(どこかでの議論によると)。それらはすべて同じエンコーディングを参照しているように思われます。その場合、少なくとも Windows 3.0 には存在していたようです。したがって、(もし本当なら) 3.1 をほのめかした MS ブックの声明を無効にしますが、まだ未解決の問題が正確にどこにありますか?