問題タブ [utf-8]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
4150 参照

c++ - C ++でMBCSストリームをUTF-8に、またはその逆に変換する

Visual C++ (VS2005) を使用しており、プロジェクトをマルチバイト文字セット (MBCS) でコンパイルしています。ただし、プログラムは XMLRPC 経由で (utf-8 の) webapp と通信する必要があります。したがって、内部で MBCS を使用し、文字列を xmlrpc モジュールに送信する前に文字列を utf-8 に変換し、webapi から受信した後に MBCS に戻すことができるのではないかと考えています。

VC++ で MBCS と UTF-8 を変換する最良の方法は何ですか?

皆さんありがとう。

0 投票する
9 に答える
12487 参照

unicode - UTF-8 でエンコードされた文字列を識別する方法

文字列 (または) が UTF-8 でエンコードされている可能性があるかどうかを識別する最良の方法は何ですか? ここでは、 Win32 APIIsTextUnicodeはあまり役に立ちません。また、文字列には UTF-8 BOM がないため、チェックできません。そして、はい、ASCII 範囲を超える文字のみが 1 バイト以上でエンコードされることを知っています。

0 投票する
4 に答える
31708 参照

unicode - GB2312をUTF-8に変換します

現在GB2312(簡体字中国語)でエンコードされているローカライズされた言語文字列を含むテキストファイルがありますが、他のすべての言語ファイルはUTF-8です。このファイルを操作するのは非常に難しいと感じています。私のテキストエディタはどれもこのファイルを正しく操作できず、破損し続けるからです。これをUTF-8に変換するためのツールはありますか?また、これを行うことの欠点はありますか?GB2312のままにして、別のエディターを使用する方がよいでしょうか(そうであれば、推奨できますか)。

更新: Windows XP(英語インストール)を使用しています。

アップデート#2: Notepad ++とNotepad2を使用してGB2312ファイルを編集しようとしましたが、どちらもファイルを読み取れず、破損します。

0 投票する
2 に答える
3674 参照

php - HTML Purifier を使用して適切に動作するにはどうすればよいですか?

PHP プロジェクトでHTML Purifierを使用していますが、ユーザー入力で正しく動作するのに問題があります。

ユーザーに WYSIWYG エディター ( TinyMCE ) を使用して HTML に入力させていますが、ユーザーが HTML エンティティ (改行なしのスペース) に入力するたびに、この奇妙な外来文字 ( Â) としてデータベースに保存されます。

ただし、保存したエントリを WYSIWYG エディタを使用して編集すると、 として適切に表示されます 。表示された場合も適切に機能しますが、ソース コードでは実際のスペースとして表示されますが、非改行スペース文字として表示されません。

また、MySQL データベースでは、奇妙な外来文字として表示されます。

Unicode と HTML Purifierに関するドキュメントを読み、データベースと Web ページのエンコーディングを UTF-8 に変更しましたが、非改行スペース文字が壊れていないという問題がまだあります。や などの他の HTML エンティティは、&lt;および&gt;として保存され<ます>が、なぜ&nbsp;でしょうか?

0 投票する
3 に答える
34271 参照

php - エンコーディングの問題がある PHP/MySQL

エンコーディングに関してPHPで問題が発生しています。

$.post を使用して PHP スクリプトと対話する JavaScript/jQuery HTML5 ページがあります。しかし、PHP はおそらくエンコーディングに関連した奇妙な問題に直面しています。

私が書くとき

PHPが出力することを期待しています&iacute;。ただし、代わりに出力されます&Atilde;&shy; 最初は、エンコーディングを間違えていると思いましたが、

「失敗」を出力しています。

しかしhtmlentities($search, null, "utf-8")、期待どおりに動作します。

PHP を MySQL サーバーと通信させたいのですが、utf8_encode を使用してもエンコーディングの問題があります。私は何をすべきか?

編集:SQLコマンドで、書き込み

XXX には í 文字が含まれていませんが、期待どおりに動作しますが、「í」文字がある場合は機能しません。

í 文字で失敗するだけでなく、「特殊」文字を含まない文字列でも失敗します。SET NAMES と SET CHARACTER SET から ' 文字を削除しても、何も変わらないようです。

PDO を使用して MySQL データベースに接続しています。

編集 2: Linux 用の XAMPP の MySQL バージョン 5.1.30 を使用しています。

編集 3: SHOW VARIABLES LIKE '%character%'PhpMyAdmin 出力からの実行

PHP スクリプト (print_r を使用) から同じクエリを実行すると、次のように出力されます。

ランニング

空の配列を出力します。

0 投票する
8 に答える
38935 参照

php - PHP の json_encode のキリル文字

PHPの関数json_encodeを使用して、キリル文字のUTF-8配列をJSON文字列にエンコードしようとしています。サンプル コードは次のようになります。

正常に動作しますが、スクリプトの結果は次のように表されます。

これにより、キリル文字ごとに 6 文字になります。エンコードされたものではなく、キーと値のペアの元の文字を取得する方法はありますか?

0 投票する
3 に答える
1118 参照

c# - エンコード変換の問題の検出

私の会社の Web サイトのコンテンツの大部分は、Word ドキュメント (Windows-1252 エンコード) として作成され、最終的に UTF-8 エンコードのコンテンツ管理システムにコピー アンド ペーストされます。変換は通常、手動でクリーンアップする必要があるいくつかの文字 (特別な改行文字、スマート クォート、科学的表記法) で停止しますが、もちろん、常にいくつかの文字がすり抜けることがあります。

これらを検出する最善の方法は何だと思いますか?

0 投票する
1 に答える
1532 参照

asp.net - asp.net プロジェクト ページを Windows-1251 から Utf-8 に変換する

Visual Studio の [名前を付けて保存] を使用してファイルごとに行うことができますが、これをワンクリックで行いたいと考えています。出来ますか?

0 投票する
4 に答える
2404 参照

c++ - UTF-8ファイルからTextBoxVC++ 6.0

古いVC++6.0 MFCプログラムでUTF8を読み取ってTextBoxまたはMessageBoxに表示するにはどうすればよいですか?できれば、現在そこに書き込まれているファイルの読み取りと表示を中断せずに(かなり実質的に)。

CString strStrに行を読み込んでから、次のコードを使用しました。

どうやってテキストボックスに入れるかはまだわかりませんが、とにかくそうする必要はないことがわかりました。