問題タブ [utf-8]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
1884 参照

ruby - RubyとRoRでUTF8を実装するために現在どのようなオプションがありますか?

Rubyの開発に非常に密接に続いて、詳細な文字エンコードがRuby1.9に実装されていることを学びました。今のところ私の質問は次のとおりです。UTF8にすべてのデータを格納するデータベースと通信するために、現時点でRubyをどのように使用できますか?

背景:私は、Ruby/RoRが少なくともオプションである新しいプロジェクトに携わっています。ただし、プロジェクトは国際化された文字セット(多くの国に広がっている)、できればUTF8に依存する必要があります。

では、どのように対処しますか?前もって感謝します。

0 投票する
4 に答える
5688 参照

ms-access - チルダ区切り文字を使用したUnicodeとしてのMSAccessテーブルのエクスポート

MSAccess2003からいくつかのテーブルの内容をエクスポートしたいと思います。テーブルにはUnicode日本語文字が含まれています。それらをチルダ区切りのテキストファイルとして保存したいと思います。

これは、ファイル/エクスポートを使用して手動で行うことができ、[詳細設定]ダイアログで、フィールド区切り文字としてチルダを選択し、コードページとしてUnicodeを選択します。

これをエクスポート仕様として保存できますが、これはテーブル固有のようです。

VBAコードを使用して多くのテーブルをエクスポートしたい。

これまでに試しました:

Sub ExportTables()

サブ終了

これを実行すると、例外が発生します。

実行時エラー「3011」:Microsoft Jetデータベースエンジンがオブジェクト「Allowance1#txt」を見つけることができませんでした。オブジェクトが存在し、その名前とパス名のスペルが正しいことを確認してください。

この時点でデバッグすると、予想どおり、TableNameは「Allowance1」になります。

私のUnicodeTildeエクスポート仕様はテーブル固有であると思うので、複数のテーブルに使用することはできません。

解決策は何ですか?TransferText以外のものを使用する必要がありますか、それともプログラムでエクスポート仕様を作成する必要がありますか?

助けていただければ幸いです。

0 投票する
4 に答える
3876 参照

c++ - Windows クリップボードのテキストが ISO 8859 か C++ の UTF-8 かを確認する方法は?

クリップボードのテキストが ISO 8859 または UTF-8 であるかどうかを検出する簡単な方法があるかどうかを知りたいですか?

これが私の現在のコードです:

0 投票する
4 に答える
14204 参照

c - WindowsのUTF-8

C WindowsプログラムでコードページをUTF-8に設定するにはどうすればよいですか?

fopenを使用してファイルを開くサードパーティのライブラリがあります。wcstombsを使用して、Unicodeファイル名を現在のコードページに変換できますが、ユーザーがコードページの外に文字を含むファイル名を持っている場合、これは機能しません。

理想的には、_setmbcp(65001)を呼び出してコードページをUTF-8に設定しますが、_setmbcpのMSDNドキュメントには、UTF-8はサポートされていないと記載されています。

どうすればこれを回避できますか?

0 投票する
7 に答える
6716 参照

php - PHP utf8 の問題

ノルウェー文字の配列を utf8 文字と比較する際に問題があります。

特殊なノルウェー文字 (æ、ø、å) を除くすべての文字が正常に機能します。

誰かが私に何ができるかについて何か考えを持っているなら、私に知らせてください.

アップデート:

これが必要な理由は、辞書のように、ノルウェー語と中国語の単語を含む行を含むテキスト ファイルを解析しようとしているからです。行を文字列に分割したいと思います。1 つはノルウェー語を含み、もう 1 つは中国語を含みます。これは後でデータベースに挿入されます。例の行:

impulsiv 形 衝動力</p>

imøtegå 動反對、反駁</p>

imøtekomme 動符合

alkoholmisbruk(er) 名氾濫用酒精 (名氾濫用酒精的人)

alkoholpåvirket 形 受酒精影響的

alkotest 名 呼吸性酒精測試</p>

alkymi(st) 名煉金術 (名煉金術士)

all, alt, alle, 形全部, すべて

ご覧のとおり、単語間にスペースが入っている可能性があるため、爆発のような簡単なものを使用して中国語とノルウェー語の単語を分割することはできません。私がしているのは、 isNorwegianChar を使用して、配列にない文字が見つかるまで行をループすることです。

問題は、æ、ø、å がノルウェー語の文字として返されず、中国語の単語が開始したと見なされることです。

コードは次のとおりです。

0 投票する
5 に答える
27317 参照

string - UTF8 対 UTF16 対 char* 対何? 誰かこの混乱を説明してくれ!

私はこのマルチバイト文字をほとんどすべて無視することができましたが、今は UI 作業を行う必要があり、この分野での私の無知が私に追いつくことを知っています! アプリケーションをローカライズするために知っておくべきことを、数段落以内で説明してくれる人はいますか? どのタイプを使用する必要がありますか (.Net と C/C++ の両方を使用しており、Unix と Windows の両方でこの回答が必要です)。

0 投票する
4 に答える
2852 参照

java - .getBytes() を呼び出すと、文字列 "¿" が "¿" に変換されるのはなぜですか?

を使用して文字列「¿」を書き出す場合

¿ だけではなく ¿ と書かれています。

なぜ?そして、どうすれば修正できますか?

0 投票する
5 に答える
3982 参照

java - UTF-8 を使用している場合でも、Windows と Linux で ¿ の表示が異なるのはなぜですか?

Linux と Windows で次の表示が異なるのはなぜですか?

Windows の場合:

¿

Linux の場合:

¿

0 投票する
5 に答える
5913 参照

c++ - ICU ライブラリを使用した UTF-8 から ASCII への変換

UTF-8 文字を含む std::string があります。
文字列を ASCII 文字に最も近いものに変換したいと考えています。

例えば:

Łódź => Lodz
Assunção => Assuncao
Schloß => Schloss

残念ながら、ICU ライブラリは非常に直感的ではなく、その使用法に関する適切なドキュメントが見つからないため、使用方法を習得するには時間がかかりすぎます。時間がありません。

誰かがこれをどのように行うことができるかについて少し例を挙げてもらえますか??
ありがとう。

0 投票する
6 に答える
10012 参照

c++ - SQLite の大文字と小文字を区別しない UTF-8 文字列照合 (C/C++)

SQLiteのカスタム照合関数で使用するために、大文字と小文字を区別しない方法で C++ の UTF-8 文字列を比較およびソートする方法を探しています。

  1. このメソッドは、理想的にはロケールに依存しない必要があります。しかし、私が知る限り、照合は言語に大きく依存しているため、ロケールの切り替えを意味する場合でも、英語以外の言語で動作するものは何でも動作します。
  2. オプションには、標準の C または C++ ライブラリ、または小規模(組み込みシステムに適した) および非 GPL (プロプライエタリ システムに適した) サードパーティ ライブラリの使用が含まれます。

私がこれまでに持っているもの:

  1. strcollC ロケールでは およびstd::collate/std::collate_bynameは大文字と小文字が区別されます。(これらの大文字と小文字を区別しないバージョンはありますか?)
  2. POSIX strcasecmp を使用しようとしましたが、それ以外のロケールでは定義されていないようです"POSIX"

    POSIX ロケールでは、strcasecmp() と strncasecmp() は上位から下位への変換を行い、次にバイト比較を行います。結果は、他のロケールでは指定されていません。

    実際、GLIBC を使用する Linux ではロケール間での結果はstrcasecmp変わりません。

    これは印刷されます:

    /li>

PS

はい、 ICUについては承知していますが、サイズが非常に大きいため、組み込みプラットフォームでは使用できません。