問題タブ [codepages]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python を使用して特定のロケール/コードページで Windows コマンド (ipconfig、netstat) を実行する方法
Pythonを使用して、、、などipconfig
のWindowsコマンドの出力を解析したい。netstat
tasklist
ただし、これらのコマンドの出力の特定の部分 (固定) は、現在のロケール/コードページに基づいて返されます。
たとえば、ipconfig
出力で
またはコードページに応じて他の言語で。
os.popen("ipconfig")
特定のロケール/コードページ設定などでコマンドを実行する方法はありますか?
locale module:
locale.setlocale(locale.LC_ALL,"american_united states")
locale.getlocale()
returnsを使用してみ"English_United States.1252"
ましたが、os.system("chcp")
それでも古い codepage:936
をos.popen("ifconfig")
返し、文字列を中国語で返します。os.system("chcp 65001")
英語の文字列を返すようos.popen("ifconfig")
になりましたが、コンソールからの以前の出力がすべてクリアされます (新しいコンソールが開く可能性があります)。これは受け入れられません。
os.popen("ipconfig")
特定のロケール/コードページ設定などでコマンドを実行する方法はありますか? どんな助けでも大歓迎です。
c# - C# で char のコードページ 850 のインデックスを特定するにはどうすればよいですか?
コードページ 850 でエンコードされたテキスト ファイルがあります。このファイルを次のように読みます。
line
ここで、コードページ 850 にあるその文字のゼロベースのインデックスの上のループ内の文字列内のすべての文字が必要です。次のようなものです。
これは可能で、どのようint GetIndexInCodepage850(char c)
に見えるでしょうか?
c++ - 電子メール メッセージのおかしな ISO エンコーディングをデコードする
電子メールの本文 (POP3 経由で取得した char[] バッファ) があります。ISO コード ページのマークアップを使用しているようです。
としてエンコードされます
それを(読み取り可能な)CStringWに変えるために使用できる既製のものはありますか?
(環境: Win32、C++、VC2008)
c - Win32コマンドラインアプリケーションでargvをワイド文字に変換する方法は?
プログラムで C 用の win32 api を使用してシリアル ポートから読み取っていますが、これはかなり低レベルのもののようです。シリアル ポートから読み取るより良い方法がないと仮定すると、CreateFile 関数には LPCWSTR 引数が含まれます。私が読んだところ、LPCWSTR は wchar_t 型のようです。まず、wchar と char の違いがよくわかりません。ANSI と Unicode については読んだことがありますが、それが自分の状況にどのように当てはまるかはよくわかりません。
私のプログラムは wmain ではなく main 関数を使用しており、コマンド ラインから引数を取得して wchar_t 変数に格納する必要があります。その場で弦を作っただけなら、これができることがわかりました。
L が char 配列を wchar 配列に変換するように見えるためです。ただし、私が行うと機能しません。
明らかに構文エラーだからです。私の質問は、通常の文字列を wchar_t 文字列に変換する簡単な方法はありますか?
または、このUnicodeのものを完全に回避し、WindowsでCを使用して別の方法でシリアルから読み取る方法はありますか..
php - htmlentities シンボルのアラビア文字を変換するにはどうすればよいですか?
htmlentities シンボルのアラビア文字を変換する必要があります。コードページ: ISO-8859-1。
sk - これは例えばアラビア記号です。
戻り値:
このシンボルから html-entities を取得するにはどうすればよいسك
ですか?
localization - ライセンス ダイアログに表示される RTF ファイルの LGHT0311 エラー
pt-BR とコードページ 860 の .wxl ファイルを用意します。何らかの理由で、pt-PT と pt-BR の残りの wix UI に含まれる wxl ファイルはコードページ 1252 を使用しています。
エラー LGHT0311 : 指定されたデータベース コード ページ '1252' では使用できない文字を含む文字列が提供されました。
これらの文字をデータベースのコード ページに存在する文字に変更するか、次の属性のいずれかを変更してデータベースのコード ページを更新します
。Product/@Codepage、Module/@Codepage、Patch/@Codepage、PatchCreation/@Codepage、または WixLocalization/@Codepage。
エラー行は、rtf ファイルの内容を読み取る場所です。
Product/@Codepage="!(loc.CodePage)" を設定する提案を見つけましたが、3.5 ではその属性にローカライズを使用できないようです。
現時点では、ja-JP、zh-CN、es-ES を含む他の 12 の言語がすべて動作します。
私が解決しようとしているオプション:
- pt または pt-BR の正しいコードページは 1 つありますか?
- テキストのどの部分がコードページに含まれていないかを知る方法は? コードページ 860 または 1252 (いずれか適切な方) に基づいて、エラーのあるテキストを指摘するにはどうすればよいですか。
- 毎回製品を再構築するのではなく、コードページを簡単に設定するにはどうすればよいですか?
- 組み込みの wxl (およびコードページ) を使用せず、代わりに必要なものを使用するように wix に指示するにはどうすればよいですか?
cmd - CMD の CodePage を永久に変更しますか?
私の Windows cmd CodePage は現在 65001 未満です。Android の操作を行っていて、コンソール ログを使用する必要があるため、変更方法は忘れてください。
chcp 437 を使用して CodePage を元に戻すと、機能します。しかし、新しいコマンド ウィンドウを開始すると、元に戻ります。
それを恒久的にするためにchcpのことをする方法は?
c++ - VS10 のデバッグ コンソールのデフォルト コード ページを変更する
現在、システム ロケールのデフォルトは 932 (日本語 Shift-JIS) ですが、デフォルトで 65001 (UTF-8) にしたいと考えています。
コードのどこかに SetConsoleOutputCP 行を挿入してから削除することで、特定のプログラムのデフォルトを変更できますが、すべてのプログラムに対してこれを行うのはかなり面倒です。
助言がありますか?
batch-file - アクセント付き文字を含む BAT/CMD ファイルの実行
パスにアクセント付き文字が含まれる場所で EXE ファイルを実行する命令を含む Windows バッチ ファイルがあります。バッチファイルの内容は次のとおりです。
C:\español\jre\bin\java.exe - このパスは存在し、適切です。このコマンドは、cmd.exe で直接実行できます。しかし、bat/cmd ファイルからコマンドを実行すると、「指定されたパスが見つかりません」というメッセージが表示されて失敗します。
これを修正する 1 つの方法は、コード ページを 1252 に設定することです (これは私にとって有効です)。しかし、英語以外のロケール用にコード ページを設定する必要があり、どのコード ページを使用するかを判断するのは非常に困難です。
この問題を解決する別の方法はありますか? 多分コマンドラインオプションか何か?
windows - Windows ANSI Western (cp 1252) が最初に登場した Windows のバージョンは?
どのバージョンの Windows が Windows ANSI Western 文字エンコーディングを導入したかについて、できるだけ明確なリファレンスを提供したいと思います。
私の主な容疑者は、Windows 1.0 (常識) と Windows 3.1 です。
Windows 3.1 は、MSDN で入手できる Microsoft の本による暗示によって主張されました。Windows 95 で使用されるエンコーディングは、Windows 3.1 で導入されたと記載されています。それはあまりにも漠然としていて、いくつかの虚偽を暗示しているため (コードページ 437、元の IBM PC 文字セットなど)、決定的な参考文献や特に信頼できるものとは見なしません。
更新: http://iana.org/assignments/character-setsで、登録された IANA 名 "ISO-8859-1-Windows-3.0-Latin-1" および "ISO-8859-1-Windows-3.1-Latin" を見つけました-1」。「windows-1252」は後で登録されました(どこかでの議論によると)。それらはすべて同じエンコーディングを参照しているように思われます。その場合、少なくとも Windows 3.0 には存在していたようです。したがって、(もし本当なら) 3.1 をほのめかした MS ブックの声明を無効にしますが、まだ未解決の問題が正確にどこにありますか?