問題タブ [utf-8]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
26107 参照

ruby - Ruby で UTF8 を ANSI に変換する

Linux マシンで UTF8 CSV ファイルをリモートで生成し、そのファイルを SFTP 経由で Wi​​ndows マシンに転送する Ruby スクリプトがあります。

次に、このファイルを Excel で開く必要がありますが、Excel は UTF8 を取得しないため、常に UTF8 を ANSI に変換できるテキスト エディターでファイルを開く必要があります。

Ruby を使用してプログラムでこれを行い、手動の変換手順を回避したいと考えています。それを行う最も簡単な方法は何ですか?

PS: iconv を使用してみましたが、成功しませんでした。

0 投票する
6 に答える
33647 参照

windows - UTF-16 から UTF-8 への変換 (Windows でのスクリプト作成用)

UTF-16 ファイルを UTF-8 に変換する最良の方法は何ですか? これをcmdスクリプトで使用する必要があります。

0 投票する
3 に答える
5860 参照

java - UTF-8 エンコーディングの処理

JMS または MQ キューから XML メッセージを取得し、それを別の JMS キューに書き込む Java アプリケーションが Weblogic サーバー上で実行されています。アプリケーションが XML コンテンツを変更することはありません。メッセージの読み取りとキューへの書き込みには、BEA の XMLObject を使用します。

XML メッセージには、エンコーディング タイプの宣言が UTF-8 として含まれています。

XML に通常の ASCII 範囲外の文字 (たとえば、£ 記号など) が含まれている場合に問題が発生します。メッセージがキューから読み取られると、£ 記号がそのままであることがわかりますが、メッセージを宛先キューに書き込むと、£ 記号は失われ、代わりに £ に置き換えられます。

OS レベルの設定 (ロケール設定) を確認しましたが、問題ないようです。これが起こらないことを確認するために、他に何を確認する必要がありますか?

0 投票する
1 に答える
2316 参照

apache - UTF-8 URI が Apache と mod_rewrite を爆発させる

mod_rewrite を使用した Apache を使用していますが、アクセント記号付きの文字を含む URI を入力すると、Apache から「ページが見つかりません」というエラーが表示されます。

URI は次のとおりです: /places/tags/Café

私のページのエンコーディングはUTF-8です。データベース接続とテーブルは UTF-8 です。私の Apache DefaultCharacterSet = UTF-8. はい、Apache には言語パックがありますが、それらは URI ではなく、ページ コンテンツ用にあると思います。

URL をパーセント記号や html エンティティにエンコードしたくないので、1 億行のデータでは特殊文字を取り除くことは現時点では実用的ではありません。

どんな助けでも大歓迎です。

0 投票する
3 に答える
11184 参照

python - UTF-8 latin-1 変換の問題、python django

わかりましたので、私の問題は、文字列 '\222\222\223\225' がデータベースに latin-1 として格納されていることです。django から (印刷して) 得られるのは、次の文字列 'ââââ¢' です。次に、この操作を行う関数に文字列を渡す必要があります。

次のエラーが表示されます。

chr() arg が範囲外 (256)

最初に文字列を latin-1 としてエンコードしようとすると、次のエラーが発生します。

'latin-1' コーデックは位置 0 ~ 3 の文字をエンコードできません: 序数が範囲外です (256)

文字エンコーディングがどのように機能するかについてたくさん読んだことがありますが、理解できないために欠けているものがあります!

0 投票する
15 に答える
182292 参照

php - ずっとUTF-8

新しいサーバーをセットアップしていて、Web アプリケーションで UTF-8 を完全にサポートしたいと考えています。過去に既存のサーバーでこれを試したことがありますが、常に ISO-8859-1 にフォールバックする必要があるようです。

エンコーディング/文字セットを正確にどこに設定する必要がありますか? これを行うには、Apache、MySQL、および PHP を構成する必要があることを認識しています。従うことができる標準的なチェックリストはありますか、または不一致が発生する場所をトラブルシューティングできますか?

これは、MySQL 5、PHP、5、および Apache 2 を実行する新しい Linux サーバー用です。

0 投票する
13 に答える
92416 参照

visual-studio - Visual Studio プロジェクトのすべてのファイルを UTF-8 として保存します

Visual Studio 2008 プロジェクトのすべてのファイルを特定の文字エンコーディングで保存することは可能でしょうか。エンコーディングが混在するソリューションを取得しましたが、それらをすべて同じにしたいです(署名付きUTF-8)。

単一のファイルを保存する方法は知っていますが、プロジェクト内のすべてのファイルはどうですか?

0 投票する
5 に答える
34773 参照

c++ - Unicode 文字列を utf-8 または utf-16 文字列に変換する方法は?

Unicode 文字列を utf-8 または utf-16 文字列に変換する方法は? 私のVS2005プロジェクトはUnicode文字セットを使用していますが、cppのsqliteは提供しています

フォルダを開くため。文字列、CString、または wstring を UTF-8 または UTF-16 文字セットに変換するにはどうすればよいですか?

どうもありがとう!

0 投票する
9 に答える
57629 参照

java - JavaでUTF-8をUS-Asciiに変換する方法

私たちには、主にヨーロッパの顧客がテキストを (UTF-8 で) 入力するシステムがあり、そのテキストはさまざまなシステムに配布する必要があり、そのほとんどは UTF-8 を受け入れますが、現在は、米国のみを受け入れる米国のシステムにもテキストを配布する必要があります。 -アスキー 7 ビット

そのため、すべてのヨーロッパ文字を最も近い US-Ascii に変換する必要があります。このタスクに役立つ Java ライブラリはありますか?

現在、変換テーブルへの追加を開始したところです。Å (スウェーデン語 AA)->A などで、入力された文字に一致するものが見つからない場合は、ログに記録して疑問符に置き換えます。次のリリースのためにそれを修正しようとしますが、非常に非効率的で、他の誰かが以前に似たようなことをしたに違いありません。

0 投票する
3 に答える
590 参照

php - PHPのUTF8で文字列に国際文字とスペースしか含まれていないことを確認するにはどうすればよいですか?

Pythonでは、Unicodeに変換して、'(?u)^ [\ w] + $'正規表現検索を実行できましたが、PHPは国際的な\wを理解していないようです。