“icu”の関連問題_Stack Overflow日本語サイト

0 投票する

0 に答える

646 参照

sorting - 日本語の並べ替え

私は、日本語での並べ替えが必要な 1 つのアプリケーションに取り組んでいます。

日本語のソートでは、カタカナと漢字をひらがなに変換してから、UTF-8 コードに従ってソートする必要があります。

ひらがな、カタカナ、漢字を組み合わせて、ひらがなに相当する「スペル」でソートします。注: ひらがな「アルファベット」を使用 – a、i、u、e、o、ka、ki、ku、ke、ki など

このタスクを実行する方法を教えてください。

論理的なステップやリンクなどのように..

ヘルプが得られるオープンソースコードがあれば教えてください。

2011-03-21T12:46:08.030

0 投票する

1 に答える

2801 参照

sorting - 日本語の文字を漢字またはカタカナまたはひらがなのいずれかに分類する方法は?

私は日本語の言語の並べ替えを必要とするいくつかのアプリケーションに取り組んでいます。

日本語のソートでは、カタカナと漢字をひらがなに変換してから、UTF-8 コードに従ってソートする必要があります。

ひらがな、カタカナ、漢字を組み合わせて、ひらがなに相当する「スペル」でソートします。注: ひらがな「アルファベット」を使用 – a、i、u、e、o、ka、ki、ku、ke、ki など

このタスクを実行するには、次のものが必要です。

1.日本語の文字を漢字かカタカナかひらがなに分類する。

2.カタカナと漢字をひらがなに変換します。

3.ひらがなに基づいてソートを行うアルゴリズムを適用します。

アプリケーションのデータベースは UTF-8 です。

ここで、第 1 ステップ「日本語の文字を漢字またはカタカナまたはひらがなに分類する」を実行します。、

Sqlite3 、 QT 、 ICU 、または Character の Unicode を提供できるその他のパッケージに C または C++ プログラミング言語用の API が存在するかどうかを知りたいですか?

Unicode に基づいて、日本語の文字を簡単に分類できます。

私が間違っている場合は修正してください。

sorting unicode sqlite cjk icu

2011-03-22T08:19:12.517

0 投票する

3 に答える

1078 参照

c - icu unicodeに相当するstrdupはありますか?

質問は自明です。C API を使用しています。

c unicode icu strdup

2011-03-23T09:56:40.053

0 投票する

1 に答える

239 参照

mysql - ロケールに基づく ICU Collator とカスタマイズルール

両方をベースにしたICU照合サービスのCollatorを同時に利用できる場合：

"ko_KR" のようなロケールベース ( coll = ucol_open("ko_KR", &status) )
カスタマイズされたルール、つまり「調整」 ( coll = ucol_openRules(rlz, rlen, UCOL_OFF,UCOL_TERTIARY,NULL,&status) )

Collator_Final = Collator_Locale + Collator_customize_rule

はいの場合、両方で同時にコレーターベースを使用する方法を提案してください。

mysql sorting sqlite locale icu

2011-03-28T04:46:02.333

0 投票する

1 に答える

682 参照

delphi - DelphiでICUを使用した人はいますか？

DelphiのICU（http://site.icu-project.org/を参照）DLLを使用した人はいますか？

特に、コードページの変換と照合機能に興味があります。

ヘッダーファイルを見ると、ほとんどがクラスを使用するC ++であるように見えるので、まだ多くの調査を行わずに、Delphiに簡単にインポートできる単純な関数をエクスポートする単純なラッパーを作成する必要があると思います。

誰かがそのために何か仕事をしましたか？

または、コードページと照合順序について同様の広範なカバレッジを持つDelphiの別のソリューションを誰かが推奨できますか？

delphi unicode collation codepages icu

2011-03-29T13:18:32.300

0 投票する

1 に答える

730 参照

visual-studio - Visual Studio Express 2008で最適に動作するICUのリリースはどれですか？

ICU 4.6には、Microsoft Visual Studio 2010用のダウンロード用のバージョンがありますが、Visual Studio 2008用にはありません。2010バージョンよりも少し無料のようで、MSDNが無料でダウンロードできるため、2008Expressを使用しています。 2008年ではそうではありませんが、2010年はそうではありません（間違っている場合は訂正してください）。

ICUの以前のリリースは4.4でしたが、これは「VisualStudio9」のダウンロードのみを提供します。現在、MicrosoftのサイトまたはWikipediaのいずれかでこのVisualStudio9に関する情報を見つけることができません。9がVisualStudio2008のC/C ++コンパイラのバージョンである可能性がありますか、それともさらに古いバージョンである可能性がありますか？

visual-studio icu

2011-03-31T09:10:04.710

0 投票する

1 に答える

589 参照

icu - UErrorCodeのメッセージを取得するためのstrerror（3）に相当するICU？

RTMを試しましたが、ICUが与えられたUErrorCode場合、対応するエラーメッセージ文字列を取得するにはどうすればよいですか？つまり、ICUの。に相当しstrerror(3)ます。

icu

2011-04-01T23:59:16.913

0 投票する

1 に答える

245 参照

mysql - ICU照合カスタマイズルールの組み合わせ方

次のように、アプリケーションで 2 つの ICU Customize Collation ルールを使用したいと考えています。

"&b < a"
"&z < w"

では、これらのルールをどのように組み合わせて、ucol_openRules() API で使用できるようにしますか?

mysql sorting sqlite icu

2011-04-08T11:25:49.800

0 投票する

1 に答える

1088 参照

c++ - ICU UnicodeString では、countChar32() と length() の違いは何ですか?

ドキュメントから;

長さは、UnicodeString にある UChar コード単位の数です。コードポイント数が必要な場合は、countChar32() を使用してください。

と

文字列の長さ UChar コード単位で Unicode コードポイントをカウントします。

コードポイントは、1 つまたは 2 つの UChar コード単位を占める場合があります。コードポイントのカウントには、すべてのコード単位の読み取りが含まれます。

このことから、コードポイントは実際の文字であり、コード単位は文字の可能な部分の 1 つにすぎないと考える傾向があります。

例えば。

次のような Unicode 文字列があるとします。

「フーバー」

長さと countChar32 の両方が 6 になります。次に、長さをエンコードするために完全な 32 ビットを使用する 6 文字で構成される文字列があるとしますが、countChar32 は 6 になります。

これは正しいです？

c++unicode icu unicode-string

2011-04-11T20:29:32.870

0 投票する

1 に答える

1346 参照

sqlite - SQLiteでアクセント/分音記号を区別しない検索を実装するには?

この質問は、ここで尋ねられた質問に関連していますが、答えがわかりませんでした。

SQLite で ICU サポートを有効にして、Db エンジンを再構築しました。SELECT UPPER("ä") を実行して ICU のサポートを確認しました。結果は Ä です。

sqlite system.data.sqlite icu

2011-04-18T15:35:00.907

問題タブ [icu]

Reference