問題タブ [character-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - WideCharToMultiByte を正しく使用するにはどうすればよいですか
WideCharToMultiByteに関するドキュメントを読みましたが、このパラメーターにこだわっています。
変数を適切に初期化して関数にフィードする方法がよくわかりません
unicode - UTF-8テキストエディタを探しています
同じドキュメント内の異なるエンコーディングのテキストを処理できる(シンプルな)テキストエディタを探しています。
日本語と英語のテキストが混在するサイトを開発する必要がありますが、現在(英語のWindowsシステムで)使用しているエディターは日本語のテキストを表示できません。Jeditファイルには入力した日本語のテキストが表示されませんが、ブラウザでファイルを見ると正しく表示されます。Gvimは、エディタとブラウザにすべての日本語テキストを疑問符として表示します。Gvimでは漢字を入力すると機能します(発音を入力してからスペースバーを押して漢字を取得します)が、希望する漢字を確認すると、その漢字が疑問符に置き換えられます。(漢字ごとに1つの疑問符)。
utf-8でエンコードされたテキストを表示し、utf-8ファイルとして保存できるhtmlおよびphpファイルを編集するためのテキストエディターを誰かに勧めてもらえますか?
ありがとうございました。
emacsについて読んだ後、私はそれをインストールしました。下記参照。
ヒントをありがとう。Unicodeフォントをまだ持っていない場合は、オンラインで見つけるか購入する必要があります。Windowsシステムにフォントをインストールする手順は次のとおりですhttp://support.microsoft.com/kb/314960
jEdit JeditのフォントをUTFフォントに変更したところ、日本語が正常に表示されるようになりました。何を入力しているのかわからないので、日本語の入力にはまだ問題があります。(フォントを変更してファイルを編集するには、[ユーティリティ]->[グローバルオプション]->[テキスト領域]に移動してUnicodeフォントを選択すると、日本語の文字が表示されます。
gVim私はまだgvimでフォントを追加する方法を理解しようとしています。その方法がわかったら、これを更新します。
EmacsEmacsは漢字を正しく表示しません。???として表示されます。でも、少なくとも日本語で何を入力したかがわかり、正しい単語を選択できます。
したがって、この時点で、jEditでは日本語のテキストは表示されますが、日本語のテキストは入力できません。Gvim日本語のテキストを入力できますが、テキスト領域内に???と表示されます。同じことがEmacsにも当てはまります。emacsとgvimにフォントを追加することは、悲しいことに簡単な作業ではありません。現在、Arial unicode MSフォントでメモ帳を使用し、日本語エディターとしてUTF-8ファイルとして保存しています。理想的ではありませんが、少なくとも機能します。
java - Java でのエンコード変換
あるエンコーディングの文字列を別のエンコーディングに変換するために使用できる無料の Java ライブラリはありますiconv
か? Java バージョン 1.3 を使用しています。
html - 疑問符の文字がテキスト内に表示されます。どうしてこれなの?
ファイルとデータベースの両方のライブサイトを自動的にバックアップするバックアップサーバーがあります。
ライブサイトでは、テキストは問題なく表示されますが、ミラーリングされたバージョンを表示すると、「?」と表示されます。一部のテキスト内。このテキストはニュースデータベーステーブルに保存されます。
これは、ライブサーバー上にあるものとミラーリングされたサーバー上にあるもののスクリーンショットです。
ミラーリングされたサーバーにバックアップするプロセス内で何が起こる可能性がありますか?
ライブサーバーはSolarisであり、ミラーリングされたサーバーはLinux Red HatLinux5です。
ruby-on-rails - RailsアプリケーションでSQL_ASCIIエンコーディングを使用するには?
ENCODING = 'SQL_ASCII';を持つ従来の postgres データベースに接続する必要があります。.
Rails アプリでこのエンコーディングを設定するにはどうすればよいですか?
c# - Web ページで有効な XML を編集するにはどうすればよいでしょうか。
手早く汚れた構成エディターを起動して実行する必要があります。流れは次のようになります。
構成 (サーバー上の POCO) は XML にシリアライズされます。
この時点で、XML は整形式です。構成は、XElements の Web サーバーに送信されます。
Web サーバーでは、XML (Yes, All of IT) が編集用のテキストエリアにダンプされます。
ユーザーは Web ページで XML を直接編集し、[送信] をクリックします。
応答では、XML 構成の変更されたテキストを取得します。この時点で、すべてのエスケープは Web ページに表示するプロセスによって元に戻されています。
文字列を XML オブジェクト (XmlElement、XElement など) に読み込もうとしました。カブーム。
問題は、シリアライゼーションが属性文字列をエスケープすることですが、これは途中の変換で失われます。
たとえば、正規表現を持つオブジェクトがあるとします。Web サーバーに関する構成は次のとおりです。
したがって、これをテキストエリアに配置すると、ユーザーには次のように表示されます。
そのため、ユーザーはわずかな変更を加えて、変更を送信します。Web サーバーでは、応答文字列は次のようになります。
そのため、ユーザーは別のバリデーターを追加しましたが、現在、両方に不正な文字を含む属性があります。これを任意の XML オブジェクトにロードしようとすると、テキスト文字列内で < と & が有効でないため、例外がスローされます。I CANNOT CANNOT CANNOT CANNOT どんな種類のエンコーディング関数も使用できません。
var 結果 = Server.HttpEncode(editedConfig);
結果は
これは有効な XML ではありません。これをあらゆる種類の XML 要素にロードしようとすると、落下する金床にぶつかります。私はアンビルが落ちるのが好きではありません。
SO、疑問が残ります...この文字列 XML を XML オブジェクトに解析できるようにする唯一の方法は、正規表現の置換を使用することですか? ロード時に「制約をオフにする」方法はありますか? これをどのように回避しますか?
有効な回答があるとは思わないので、最後の回答とこれを wiki 化します。
テキストエリアに配置した XML は有効で、エスケープされた XML です。1) テキスト領域に配置する 2) クライアントに送信する 3) クライアントに表示する 4) フォームを送信する 5) サーバーに送信する 6) フォームから値を取得する 削除するありとあらゆる逃避。
もう一度言いますが、私は何もエスケープしていません。ブラウザに表示するだけでこうなる!
熟考すべきこと: そもそもこの非エスケープが起こらないようにする方法はありますか? ほぼ有効な XML を安全な方法で "クリーン" にする方法はありますか?
この質問には賞金があります。報奨金を集めるために、正規表現を使用して属性値を手動でエスケープする必要がなく、ユーザーが属性をエスケープする必要がないサードパーティ/オープンソース ツールを使用せずに、ブラウザ ウィンドウで VALID XML を編集する方法を示してください。ラウンドトリップ時に失敗しません(&amp;etc;)
character-encoding - データベースで使用されている文字セットを見つける方法
.NET プログラム (ODBC を使用) またはデータベース管理ツール (Java で記述) からデータベースにアクセスできます。
.NET プログラムからデータベースに 'é' 文字を書き込むと、DB 管理ツールでは 'Õ' (チルダ付きの大文字の O) として表示されます。
DB管理ツールからデータベースに「é」を書き込むと、.NETプログラム上では「Å」(大文字のAの上に丸)と表示されます。
私は実際に問題を解決しようとしているわけではありません (つまり、両方のプログラムが同じことを表示すること)。.NET を使用してデータをダンプし、ツールを使用して再入力した場合に自分で変換できるように、それぞれがデータの解釈に使用している文字セットを推測しようとしているだけです。
では、上記の文字の不一致を引き起こすのは、2 つの文字セットのどの組み合わせでしょうか?
ご協力いただきありがとうございます。
編集: Sybase ASE 12.5を使用
編集:基本的に質問です: E9 コード ポイントが文字 'Õ' (大文字の O にチルダ) または 'Å' (大文字の A に丸印) を表す文字エンコーディングを知っていますか? (これは、そのうちの1人がLatin 1を使用しているため、E9であると想定しています。これはかなり可能性が高いと思います)
編集:ポールのソリューションはそれを行います。文字セットに関する答えは次のとおりです: hp-roman8
unicode - HtmlEncode UTF-8
私は、Rüstü Recber (Rüstüstà ;¼ソースのRecber)。
Response.Charset プロパティを utf-8 に設定しようとしましたが、違いはありません。
java - Java アプリケーションが特殊文字で失敗する
私が取り組んでいるアプリケーションは、ファイルから情報を読み取ってデータベースに入力します。ファイル内の一部の文字は、アクセント付きのフランス語の文字など、英語以外のものです。
アプリケーションは Windows では正常に動作していますが、Solaris マシンでは特殊文字を認識できず、例外がスローされています。たとえば、「Gérer」でアクセント付きの e に遭遇すると、次のように表示されます:-
(アプリケーションからスローされる例外)
これを防ぐには、JVM の file.encoding プロパティを変更する必要があると思います。System.setProperty() を介してこれを実行しようとしましたが、エラーの発生が停止しませんでした。
私ができることについて何か提案はありますか?/etc/default/init にある solaris プラットフォームの基本ロケールを UTF-8 に設定することを考えていました。これが役立つと思う人はいますか?
どんな考えでも大歓迎です。
mysql - mysql 文字セット cli
mysql データベースの文字セットが何に設定されているかを確認するにはどうすればよいですか? クリで?