問題タブ [codepages]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows - コードページ 850 は機能しますが、65001 は失敗します。「call foo.cmd」に対する応答はありません。内部コマンドは正常に動作します
質問は基本的に問題を説明しています。
Windows XP Pro Service Pack 3 を使用しています
ComSpec=C:\WINDOWS\system32\cmd.exe
スタートからコンソールを起動しました... ファイル名を指定して実行ダイアログ... cmd.exe
これが私のコンソールの「ビュー」です:
コマンド、出力 (および // コメント)
上記は正常に機能します(予想どおり)。Windows ランドでは問題はありませんが、コードページ 65001 に切り替えると「呼び出し」が失敗します。
ここで何が起こっているのですか(起こっていないのですか)?
character-encoding - コード ページの使用に関する用語と概念
私はコード ページを調査している最中であり、ウィキペディアのさまざまなエントリ間でさえ、多くの矛盾する用語の使用に遭遇しました。キャラクターの取り扱いプロセス全体を最初から最後まで詳しく説明している情報源が見つかりません。この分野に精通した誰かが、次の情報が不正確または間違っている方法を提案できますか?
私が理解している限りのキャラクター表現のプロセス:
特定のプラットフォームに関連付けられていない一連のシンボル (ここでの正しい用語は不明、おそらく「スクリプト」) から始めます。「キリル文字」は、たとえば、Windows のコンテキストでは Linux と同じエンティティを指すと理解されています。
これらのセットのメンバーは、プラットフォーム固有の文字セットを形成するためにベンダーによって一般的にまとめて選択されます。プラットフォームは、Windows の GDI 値などのさまざまなコードを割り当てる場合があります (例: ANSI_CHARSET の場合は 0、およびここで言及されているその他のコード: http://asa.diac24.net/wiki/index.php?title=ASS:fe&printable=yes ) . これらの文字セットが実際にコード化された文字セットなのか、それとも単純に順序付けられていない抽象的なものなのかなど、これらのセットに関する多くの情報を見つけることができません。
これらのセットから、GDI 値と 1 対 1 でマッピングされているように見える個々のコード ページが作成されます。これらの GDI 値はプラットフォームに依存するセットを表しているように見えるので、これは Windows コード ページが本質的に個々のセットのコード化されたバージョンであることを意味しますか?
この考えと、異なるプラットフォーム間でのこれらの GDI 文字セットとコード ページとの間の 1 対多のマッピングを示す以前に表示されたリンク (失くしてしまいました) との調整に苦労しています。これは正確ですか?これらの GDI 値は、さまざまなプラットフォームでさまざまなコード ページを開発できるセットを指していますか?
各コード ページは、抽象文字セットのメンバーを整数にマップして、セット内の位置を表します。上記の Web ページで言及されている「より単純な」コード ページの場合、これらはより正確な「文字マップ」という用語を使用して参照できます。この用語は検討する価値がありますか、それとも区別が微妙すぎて重要ではありませんか?
フォントは、そのコード ポイントのグリフが含まれている場合、そのコード ポイントをグリフに解決します。そうでない場合は、失敗を報告します。また、フォントがサポートしていないコード ポイントに対して独自の空白のグリフを返す場合があることも読みました。アプリケーションは、この空白のグリフと成功した解決を区別できますか。フォントは、この空白のグリフのようなエラー コードを返しますか?
それが私の混乱の程度だと思います。この点に関する説明は非常に貴重です。前もって感謝します。
encoding - 「エンコーディング」、「文字セット」、「コードページ」の違いは何ですか?
私は本当にこのようなもので良くしようとしています。私はこのような国際化の概念でかなり機能的ですが、その背後にある理論についてより良い背景を得る必要があります。
Spolskyの記事を読んだことがありますが、これらの3つの用語は、その記事でも同じ意味で使用されているため、まだわかりません。少なくとも2人は同じことを話していると思います。
私は、開発者の大部分が日常的にこのようなものを通り抜けているのではないかと思います。私はもうそれらの開発者の一人になりたくありません。
delphi - Delphi2006実行可能ファイルのコードページを設定する方法
Multilizer 5.1を使用してプログラムを翻訳し、Delphi2006でプログラミングしています。ここで、Multilizerの新しい言語としてポーランド語を追加しました。しかし、実行可能ファイルを開くと、Multlizerは「ポーランド語はコードページでサポートされていません」と言います。
地域設定をポーランド語に調整すると、実行可能ファイルを開くたびに、地域設定が元の設定であるオランダ語に戻ります。プロジェクトオプションでCodePage設定を設定する必要があるかもしれませんが、ドロップダウンリストにはオプションが表示されません。
何か案は?
python - PythonでWindowsコードページを変更するにはどうすればよいですか?
コードページを 65001 に設定した後、次に chcp を呼び出すと、アクティブなコードページは 437 ではなく 65001 であると表示されます。これを Windows コマンド プロンプトで試してみたところ、うまくいきました。Pythonコードで機能しないのはなぜですか?
unicode - RTF16進リテラルをUnicodeに変換するときに使用するコードページを見つける方法
他の言語のコンテンツが含まれている可能性のあるWord2003+によって生成されたRTF1.5+ファイルを解析しています。このコンテンツは通常、16進リテラル(\'xx)としてエンコードされます。これらのリテラルをUnicode値に変換したいと思います。
ansicpg(\ ansi \ ansicpg1252)を探すことで、自分のドキュメントのコードページを知ることができます。
ansicpgコードページを使用してUnicodeにデコードすると、多くの言語(フランス語など)が期待するUnicode文字値に変換されるようです。
ただし、ロシア語のテキスト(以下のような)を見ると、コードページ1252はコンテンツをジバーリッシュにデコードします。
\ f277 \ lang1049 \ langfe1033 \ langnp1049 \ insrsid5989826 \ charrsid6817286 \'d1 \'f2 \'f0 \'e0 \'ed \'e8 \'f6 \'fb \'e1 \'e5 \'e7 \'ed \ ' e0 \'e7 \'e2 \'e0 \'ed \'e8\'ff。\'dd \'f2 \'e0 \'f1 \'f2 \'f0 \'e0 \'ed \'e8 \'f6 \'e0 \'ed \'e5 \'e4 \'ee \'eb \ ' e6 \'ed \'e0 \'ee \'f2 \'ee \'e1 \'f0 \'e0 \'e6 \'e0 \'f2 \'fc \'f1 \'ff \'e2 \'f2 \ 'e0 \'e1 \'eb \'e8 \'f6 \'e5 \'e2 \'f1 \'ee \'e4 \'e5 \'f0 \'e6 \'e0 \'ed \'e8 \'e8 。
lang1049、langfe1033、langnp1049が手がかりを提供してくれるので、それらが参照するテキストに対してプログラムで別の(デフォルト以外の)コードページを選択できると思いますか?もしそうなら、lang *コードをコードページにマップする方法を説明する情報はどこにありますか?または、探している情報を提供するために、他のRTFコマンド/ディレクティブを探す必要がありますか?(または、フォント参照として\ f277を使用して、関連するコードページがあるかどうかを確認する必要がありますか?)
c++ - MySQL++ のコードページ関連の問題
コード:
mysqlpp::Query acc_query = connection->query("SELECT * FROM accounts;");
次のコードは以下を生成します。
_Gfirst = 0x00c67718 "SELECT * FROM accounts;ээээ««««««««юоюою"
Visual Studio デバッガーと同様。奇妙な結果でクエリが失敗するようです。
他の誰かがそれに遭遇しましたか?
encoding - grave =xC1acute = xC2 cedilla=xD0のシングルバイトエンコーディングを探しています
これらの位置にアクセントがあるコードページまたは他のシングルバイトエンコーディングを見つけるのに問題があります:
xD0のxC2セディーユのxC1急性の墓
windows - Windows の各言語バージョンの既定のコード ページ
Windows の各言語バージョンの既定のコード ページに関する情報はどこにありますか? つまり、各言語バージョンの「ANSI」コード ページです。
Windows でサポートされているコード ページは見つかりましたが、各言語の既定値が見つかりません。
たとえば、ギリシャ語バージョンをインストールする場合、Windows-1253 (ギリシャ語) がデフォルトであると思います。しかし、他のコード ページはどうでしょうか。また、Windows-1253 は他の言語バージョンのデフォルトですか?
vb.net - VS2008 - VB.net フォント ダイアログ - コードページ/言語によるフォントのフィルター処理
更新 (Hans Passant からの最初の回答に応じて): ユースケースを十分に説明していないと思います。このアプリケーションは、ユーザーが「マスター」言語 (ほとんどの場合英語ですが、必ずしもそうとは限りません) でデータを入力し、別の言語で翻訳を入力できるように設計されています。これはすべて、リッチテキスト ボックス インターフェイスで行われます。
したがって、翻訳を入力するために使用するフォントは、翻訳先の言語のスクリプトをサポートするフォントでなければなりません。
「ターゲット言語」がわかっている場合は、その言語でのテキストの入力をサポートするフォントのみをリストするとよいでしょう。
================================================== ====================
私は、SQL Server バックエンドを使用して VB.net アプリケーションに取り組んでいます。西欧文字以外の言語 (中国語、日本語、アラビア語など) を含む複数の言語でのリッチ テキスト エントリ (ユーザーから承認) をサポートする予定です。
ユーザーが使用したい言語を選択できるダイアログがあります。言語ごとに、ユーザーはアプリケーションのリッチ テキスト ボックスにその言語のテキストを入力するための適切な (既定の) フォントを指定する必要があります。
例: ユーザーは中国語でテキストを入力したいので、アプリケーションで使用する言語として「中国語」を選択します。ユーザーは漢字を入力するフォントを指定する必要があります。そのため、Windows.Forms.FontDialog を表示します。
このフォント選択ダイアログで、選択した言語のコードページ (スクリプト) に基づいて、使用可能なフォントのリストをフィルター処理できるようにしたいと考えています。
たとえば、フォント「Brush Script MT」は西洋文字のみをサポートし、中国語はサポートしていません。したがって、ユーザーが中国語のテキストを入力するためにフォントを選択している場合、「Brush Script MT」フォントはリストに表示されません。
これを達成する方法について誰かアイデアがありますか? System.Text.Encoding を使用して、ローカル システムで使用されている Windows コードページの番号を取得することから始めました。正しい道をたどっていますか?
助けてくれてありがとう!
マット