問題タブ [icu]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - フィルタリストなしで Locale::acceptFromHttp を使用するには?
locale_accept_from_http
は ICU の API の基本的なラッパーですuloc_acceptLanguageFromHTTP
が、PHP/PECL の実装には根本的に欠陥があるようで、リストをパラメーターとして使用する代わりに、システムのロケール セット全体を使用します。
たとえば、ユーザーが を持っているとしますHTTP_ACCEPT_LANGUAGE = zh-HK;q=0.2, fr
。つまり、ユーザーは繁体字中国語またはフランス語を読み、後者を好みます。たとえば、繁体字中国語と簡体字中国語の記事を提供するニュース サイトがあるとします。API
Locale::acceptFromHttp
を使用すると、 のみが返されfr
ます。
出力:
java - icu4j キリル文字からラテン文字へ
URLにキリル文字を含めることができるように、キリル文字をラテン語にしようとしています。私はicu4j 文字変換を使用していますが、それでもVilândimaaのような奇妙な文字が表示されます。もっとviljandimaaに似ているはずです。その URL をコピーすると、これらの文字は %.. に変わります。
icu4j でキリル文字を az に変換する方法を知っている人はいますか?
アップデート
まだ自分自身に答えることはできませんが、非常に役立つこの質問を見つけました: Converting Symbols, Accent Letters to English Alphabet
unicode - ICUでラテン語⇔漢語変換?
C++ プログラムで ICU4C を使用して ICU 変換を実装し始めたところです。私は特に中国語への、または中国語からの音訳に注目しています。
このドキュメントによると、パッケージは「Han-Latin」と「Latin-Han」の両方の変換をサポートしています。ラテン語から漢語への変換は、高度な統計技術なしでは特に難しいため、中国語の学生としては、これは驚くべきことのように思えます (私が見た中で最も近いのは Google Transliterate で、ユーザー入力がなくても実際にこれで素晴らしい仕事をします.しかし、これは現在のプロジェクトでは実現不可能です)、声調記号なしの変換はなおさらです。比尔·莫瑞のような事実上の外国の名前の借用文字に頼ることなく、これが可能であることに私は懐疑的です. この論文(PDF)でわかるように、これは Google マップが国際的なドメインで採用しているアプローチです。
とにかく、私は信じられないことを喜んで保留し、ドキュメントとチュートリアルを参照した後、2 つの Transliterator オブジェクト (to と from) を構築し、それらを使用して簡単な音訳を実行することができました。
Han-Latin はまずまずに機能しましたが (単純なデータで約 80% の精度)、Latin-Han はまったく機能していないようで、入力されたものと同じ「ラテン」文字列を返しました。これは、オンライン変換を使用して得た結果と一致しています。サンプルであり、私が中国語について知っていることと一致しています。ここでわかるように、私はこのテーブルを見つけることができました。これは両方のソースに使用されていると思います:
これは、ピンイン文字列を指定すると、元の文字列を再現できる可能性があることを意味していると思いますが、そうではないようです。
私の一般的な質問は次のとおりだと思います。この種の変換は、ICU や Google Transliterate 以外でも可能ですか? 期待される出力は何ですか?関連して、ICUが実際にサポートしているスクリプト ペアのリストがどこかにありますか (これが本当に可能でない場合)。
お時間をいただきありがとうございます
c++ - VS2008 で ICU サンプルをビルドする際の問題
Visual Studio 2008 を使用してICU4C サンプル「uncv 」をビルドしようとしましたが成功しませんでした
- ヘッダー ディレクトリを追加しました ([構成プロパティ] > [C/C++] > [全般] > [追加のインクルード ディレクトリ])。
- lib フォルダーを参照しました ([構成プロパティ] > [リンカー] > [追加のライブラリ ディレクトリ])。
- binフォルダーをPATH環境変数に追加しました
種類のエラーを構築した後、「未解決の外部シンボル...関数で参照されています...」が表示されます。私は何か不足していますか?
c++ - boost :: asio:write呼び出しを使用してICU UnicodeStringを送信するにはどうすればよいですか?
UnicodeString
現在、ICUライブラリを使用してUnicodeデータを処理しており、ソケットを介して送信しようとしています。現在、基本的なタイムサーバーを使用した例を見てみましょう。
boost::asio::buffer
ここで、さまざまな関数シグネチャを調べたところ、がかかるように見えますがboost::asio::const_buffer
、が与えられた場合の変換がどのように機能するかはわかりませんUnicodeString
。に変換するにはどうすればよいですかconst_buffer
、またはこれを行うための別の方法はありますか?よろしくお願いします。
c++ - ICUでchar*からUCharに変換できますか?
ICUに渡してANSI(ISO-8859-6)に変換したいchar *(utf-8文字列を含む)があります。残念ながら、ほとんどのICU関数はchar*ではなくUCharを使用しているようです。
どうすればこの変換を行うことができますか?
icu - icuとメモリからのコンバータ
メモリからコンバータを作成したい。
etrypoint_datを作成し、次にコンバーターからcファイルを作成し、2つの構造体を結合しました。
私が呼ぶコードから
今私の質問:setAppDataの呼び出し後にコンバーターを作成するにはどうすればよいですか?
以下は機能しません。
c++ - ICUの使用方法の簡単で実用的なC++の例を探しています
ICUの使用方法に関する簡単で実用的なC++の例を探しています。
ICUのホームページはこの点では役に立ちません。
Unicodeの内容と理由には興味がありません。
いくつかのデモは自己完結型ではなく、コンパイル可能な例ではありません(インクルードはどこにありますか?)
「Hello、World」のようなものを探しています:
UTF-8でエンコードされたファイルを開いて読み取る
方法STL/Boost文字列の使用方法UTF-8でエンコードされた文字列などを操作する関数。
c++ - ICU と文字列の比較
次の比較が等しくない理由を誰か説明できますか?