問題タブ [character-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
2292 参照

ms-word - 'hello'をWordからtextareaにコピーして貼り付けると、保存後に018hello019になります

Wordに「hello」があり、貼り付けると018hello 019になるので、アポストロフィがこれらの奇妙な文字に変わります。

使用するワークステーションによって動作が異なるため、Webアプリケーションの種類は重要ではありません。

メモ帳、Excel、ワードパッドで確認しましたが、この問題は発生せず、Wordでのみ発生します。

Word/IE設定である必要があります。

どれか知っていますか?

ありがとう

0 投票する
1 に答える
456 参照

c - posix c 関数を使用した文字エンコーディングの変換

Windows-1251からutf-8に、またはその逆に、エンコーディングを変換するための標準のposix C関数はありますか?

0 投票する
3 に答える
11685 参照

python - いくつかのバイトの文字エンコーディングを推測しようとする Python ライブラリ関数はありますか?

Python でメール処理ソフトウェアを作成していますが、ヘッダー フィールドで奇妙なバイトが発生しています。これはただの不正なメールだと思います。メッセージ自体は us-ascii であると主張しているため、真のエンコーディングはないと思いますが、UnicodeDecodeError.

だから、私は astrとオプションでいくつかのヒントを取り、私に a を返すために最も大胆なことをする関数を探していunicodeます。もちろん、私が書くこともできますが、そのような関数が存在する場合、その作成者はおそらくこれを行う最善の方法についてもう少し深く考えているでしょう.

また、Python の設計は暗黙的よりも明示的なものを好み、標準ライブラリはテキストをデコードする際の暗黙的な魔法を回避するように設計されていることも知っています。「先に進んで推測してください」と明示的に言いたいだけです。

0 投票する
3 に答える
11184 参照

python - UTF-8 latin-1 変換の問題、python django

わかりましたので、私の問題は、文字列 '\222\222\223\225' がデータベースに latin-1 として格納されていることです。django から (印刷して) 得られるのは、次の文字列 'ââââ¢' です。次に、この操作を行う関数に文字列を渡す必要があります。

次のエラーが表示されます。

chr() arg が範囲外 (256)

最初に文字列を latin-1 としてエンコードしようとすると、次のエラーが発生します。

'latin-1' コーデックは位置 0 ~ 3 の文字をエンコードできません: 序数が範囲外です (256)

文字エンコーディングがどのように機能するかについてたくさん読んだことがありますが、理解できないために欠けているものがあります!

0 投票する
21 に答える
146350 参照

php - 疑問符の付いた小さな黒いひし形を示す PHP 出力

データベースソースからプルするphpプログラムを書いています。一部の varchars には、疑問符が含まれる黒いひし形として表示される引用符があります (�, REPLACEMENT CHARACTER、Microsoft Word テキストからだと思います)。

php を使用してこれらの文字を削除するにはどうすればよいですか?

0 投票する
2 に答える
290 参照

python - mysqldbから誤って出てくるように見える情報、python django

latin-1 データベースには ' \222\222\223\225' があり、django モデルからこのフィールドを取得しようとすると、 が返されu'\u2019\u2019\u201c\u2022'ます。

だから私はそれに足を踏み入れて入ります

/usr/local/python2.5/lib/python2.5/site-packages/MySQL_python-1.2.2-py2.5-linux-i686.egg/MySQLdb/cursors.py(327)fetchone()->(u '\u2019...1c\u2022',)

これは卵であるため、これ以上踏み込むことはできませんが、MySQL python ドライバーがデータをラテン 1 として解釈していないようです。

誰が何が起こっているのか手がかりを持っていますか?

0 投票する
13 に答える
92416 参照

visual-studio - Visual Studio プロジェクトのすべてのファイルを UTF-8 として保存します

Visual Studio 2008 プロジェクトのすべてのファイルを特定の文字エンコーディングで保存することは可能でしょうか。エンコーディングが混在するソリューションを取得しましたが、それらをすべて同じにしたいです(署名付きUTF-8)。

単一のファイルを保存する方法は知っていますが、プロジェクト内のすべてのファイルはどうですか?

0 投票する
5 に答える
34773 参照

c++ - Unicode 文字列を utf-8 または utf-16 文字列に変換する方法は?

Unicode 文字列を utf-8 または utf-16 文字列に変換する方法は? 私のVS2005プロジェクトはUnicode文字セットを使用していますが、cppのsqliteは提供しています

フォルダを開くため。文字列、CString、または wstring を UTF-8 または UTF-16 文字セットに変換するにはどうすればよいですか?

どうもありがとう!

0 投票する
1 に答える
352 参照

mysql - ドキュメントで宣伝されているように MySQL 照合が機能しない

このMySQL リファレンスページの例 2 の utf8 テーブルとして動作するように MySQL テーブルを取得しようとしています。

例によると、これは次のようになります。

しかし、私が得ているのは単純"Bär"です。私は何か間違ったことをしていますか?設定を調整する必要がありますか?

Mac OS X の MySQL 5.0.45 と Red Hat の 5.0.51a でこれを試しました。

編集: を設定しようとしSET NAMES 'utf8'ましたが、それでも同じ結果が得られます。そうした後、私の変数は

0 投票する
5 に答える
76648 参照

python - Pythonでurlencoded unicode文字列の引用符を外す方法は?

「Tan%u0131m」としてエンコードされた「Tanım」のようなユニコード文字列があります。このエンコードされた文字列を元のユニコードに変換するにはどうすればよいですか。どうやら urllib.unquote はユニコードをサポートしていないようです。