問題タブ [icu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
646 参照

sorting - 日本語の並べ替え

私は、日本語での並べ替えが必要な 1 つのアプリケーションに取り組んでいます。

日本語のソートでは、カタカナと漢字をひらがなに変換してから、UTF-8 コードに従ってソートする必要があります。

ひらがな、カタカナ、漢字を組み合わせて、ひらがなに相当する「スペル」でソートします。注: ひらがな「アルファベット」を使用 – a、i、u、e、o、ka、ki、ku、ke、ki など

このタスクを実行する方法を教えてください。

論理的なステップやリンクなどのように..

ヘルプが得られるオープン ソース コードがあれば教えてください。

0 投票する
1 に答える
2801 参照

sorting - 日本語の文字を漢字またはカタカナまたはひらがなのいずれかに分類する方法は?

私は日本語の言語の並べ替えを必要とするいくつかのアプリケーションに取り組んでいます。

日本語のソートでは、カタカナと漢字をひらがなに変換してから、UTF-8 コードに従ってソートする必要があります。

ひらがな、カタカナ、漢字を組み合わせて、ひらがなに相当する「スペル」でソートします。注: ひらがな「アルファベット」を使用 – a、i、u、e、o、ka、ki、ku、ke、ki など

このタスクを実行するには、次のものが必要です。

1.日本語の文字を漢字かカタカナかひらがなに分類する。

2.カタカナと漢字をひらがなに変換します。

3.ひらがなに基づいてソートを行うアルゴリズムを適用します。

アプリケーションのデータベースは UTF-8 です。

ここで、第 1 ステップ「日本語の文字を漢字またはカタカナまたはひらがなに分類する」を実行します。、

Sqlite3 、 QT 、 ICU 、または Character の Unicode を提供できるその他のパッケージに C または C++ プログラミング言語用の API が存在するかどうかを知りたいですか?

Unicode に基づいて、日本語の文字を簡単に分類できます。

私が間違っている場合は修正してください。

0 投票する
3 に答える
1078 参照

c - icu unicodeに相当するstrdupはありますか?

質問は自明です。C API を使用しています。

0 投票する
1 に答える
239 参照

mysql - ロケールに基づく ICU Collat​​or とカスタマイズ ルール

両方をベースにしたICU照合サービスのCollat​​orを同時に利用できる場合:

  1. "ko_KR" のようなロケールベース ( coll = ucol_open("ko_KR", &status) )

  2. カスタマイズされたルール、つまり「調整」 ( coll = ucol_openRules(rlz, rlen, UCOL_OFF,UCOL_TERTIARY,NULL,&status) )

Collat​​or_Final = Collat​​or_Locale + Collat​​or_customize_rule

はいの場合、両方で同時にコレーターベースを使用する方法を提案してください。

0 投票する
1 に答える
682 参照

delphi - DelphiでICUを使用した人はいますか?

DelphiのICU(http://site.icu-project.org/を参照)DLLを使用した人はいますか?

特に、コードページの変換と照合機能に興味があります。

ヘッダーファイルを見ると、ほとんどがクラスを使用するC ++であるように見えるので、まだ多くの調査を行わずに、Delphiに簡単にインポートできる単純な関数をエクスポートする単純なラッパーを作成する必要があると思います。

誰かがそのために何か仕事をしましたか?

または、コードページと照合順序について同様の広範なカバレッジを持つDelphiの別のソリューションを誰かが推奨できますか?

0 投票する
1 に答える
730 参照

visual-studio - Visual Studio Express 2008で最適に動作するICUのリリースはどれですか?

ICU 4.6には、Microsoft Visual Studio 2010用のダウンロード用のバージョンがありますが、Visual Studio 2008用にはありません。2010バージョンよりも少し無料のようで、MSDNが無料でダウンロードできるため、2008Expressを使用しています。 2008年ではそうではありませんが、2010年はそうではありません(間違っている場合は訂正してください)。

ICUの以前のリリースは4.4でしたが、これは「VisualStudio9」のダウンロードのみを提供します。現在、MicrosoftのサイトまたはWikipediaのいずれかでこのVisualStudio9に関する情報を見つけることができません。9がVisualStudio2008のC/C ++コンパイラのバージョンである可能性がありますか、それともさらに古いバージョンである可能性がありますか?

0 投票する
1 に答える
589 参照

icu - UErrorCodeのメッセージを取得するためのstrerror(3)に相当するICU?

RTMを試しましたが、ICUが与えられたUErrorCode場合、対応するエラーメッセージ文字列を取得するにはどうすればよいですか?つまり、ICUの。に相当しstrerror(3)ます。

0 投票する
1 に答える
245 参照

mysql - ICU照合カスタマイズルールの組み合わせ方

次のように、アプリケーションで 2 つの ICU Customize Collat​​ion ルールを使用したいと考えています。

  1. "&b < a"
  2. "&z < w"

では、これらのルールをどのように組み合わせて、ucol_openRules() API で使用できるようにしますか?

0 投票する
1 に答える
1088 参照

c++ - ICU UnicodeString では、countChar32() と length() の違いは何ですか?

ドキュメントから;

長さは、UnicodeString にある UChar コード単位の数です。コード ポイント数が必要な場合は、countChar32() を使用してください。

文字列の長さ UChar コード単位で Unicode コード ポイントをカウントします。

コード ポイントは、1 つまたは 2 つの UChar コード単位を占める場合があります。コード ポイントのカウントには、すべてのコード単位の読み取りが含まれます。

このことから、コード ポイントは実際の文字であり、コード単位は文字の可能な部分の 1 つにすぎないと考える傾向があります。

例えば。

次のような Unicode 文字列があるとします。

「フーバー」

長さと countChar32 の両方が 6 になります。次に、長さをエンコードするために完全な 32 ビットを使用する 6 文字で構成される文字列があるとしますが、countChar32 は 6 になります。

これは正しいです?

0 投票する
1 に答える
1346 参照

sqlite - SQLiteでアクセント/分音記号を区別しない検索を実装するには?

この質問は、ここで尋ねられた質問に関連していますが、答えがわかりませんでした。

SQLite で ICU サポートを有効にして、Db エンジンを再構築しました。SELECT UPPER("ä") を実行して ICU のサポートを確認しました。結果は Ä です。