問題タブ [transliteration]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - JavaScript関数を使用してキリル文字をラテン語に音訳する
私はこの機能を作りました:
これで、キリル文字をラテン語に音訳し、ラテン語を単純に通過させる必要があります。しかし、それは最初の文字を後で音訳することしかできず、ラテン語の場合、答えとして undefined を返します。誰が私にアイデアを与えることができますか、私は何が間違っていますか?
java - Javaを使用してヒンディー語とラテン文字の間でヒンディー語のテキストを音訳するにはどうすればよいですか?
Javaを使用して英語のアルファベットで書かれたヒンディー語の意味をヒンディー語に変換するには?
例えば。
入力テキスト: anil NE lath marke apko Ganga me hi Fenk diya.
ヒンディー語で
出力テキストは次のとおりです。
Java または任意の Java API を使用して変換する方法は?
Google 以外の Jitter という API が好きですが、エラーが発生します
ソースコードは
java - Google APIを使用せずにJavaでUnicodeを音訳しますか?
英語のユニコードからグジャラートのユニコードへの解決策はありますか? a = \u0061 のユニコードを想定すると、અ = u0095 に変換されます。
unicode - モバイルが J2ME で特定の言語のユニコードをサポートしているかどうかを検出する方法
私は J2me でアプリケーションを設計しています。ここでは、特定の言語 (ウルドゥー語など) でインターフェイスを提供する必要があります。私がやっていることは、Unicode 文字を使用して、「ようこそ」などのラベルを自分の言語に印刷し、正しい方法で表示することです。このアプリケーションはさまざまなモバイル モデルで実行されることになっているため、アプリケーションを実行している特定のモバイルが言語の Unicode をサポートしているかどうかをプログラムで確認できるかどうかを知りたいだけです。そうでない場合は、デフォルトの英語でラベルを表示するためです。英語のアルファベットを自分の言語の文字に変換する以外は、まだコーディングしていません。知りたいだけで、可能であれば、このチェックを実行する方法を見つけたいと思っています。前もって感謝します :)
icu - ウルドゥー語からラテン語への音訳が icu4c で正しく機能しないのはなぜですか?
このウルドゥー語の行をラテン語に変換してから、ラテン文字を (アクセントを削除するなどして) ASCII に変換しようとしていますが、一部の文字が欠落しているようです。
非ラテン文字 (「ہ」、「ے」など) がまだ存在するのはなぜですか?
Any-ASCII
トランスリテレータが ASCII に変換しないのはなぜですか?
c++ - CJK からラテン語への音訳 -- できれば C++ で
CJK をラテン語 (ピンイン、ローマ字など) に音訳できるプログラムを作成しようとしています。たとえば、中国語、日本語、または韓国語のドキュメントを入力として指定すると、ラテン語に翻字されたバージョンが出力として取得されます。
私はこの分野では新しいので、ここで我慢してください。
明らかに、先に進む前に、まず言語の種類 (中国語、日本語、または韓国語) を検出する必要があります。次に、これまでに理解したように、文字変換を行うには、テキストを単語に分割する必要があります。これらの言語では単語間にスペースがないためです。これは単語分割と呼ばれます。最後に、必要な単語を見つけた後、それらをラテン語に音訳する必要があります。
だからここに私の質問があります:
- 私は C/C++ でオープン ソースのものを探しているので、文字変換の仕事をするライブラリはたくさんあります (実際にはそうではありません! いくつか言うとよいでしょう)。Adson (中国語のみ) と ICU4C を見つけました。Adson から複製された Git リポジトリがコンパイルされませんでした。また、ICU4C のシンプルでわかりやすいチュートリアルを見つけることができませんでした。ICU4C の使用法に関するチュートリアルを見つけるにはどうすればよいですか? CJK をラテン語に音訳する他のライブラリを知っていますか? 正解率が高ければ (~90%)、C++ で書かれていることを忘れることができます。
c++ - ICUを使用した単語のセグメンテーション
ICU4Cを使用してCJKを音訳しています。ICUで単語セグメンテーションを使用して、中国語のテキストを単語セグメンテーション標準に従って定義された一連の単語に分割できるかどうか疑問に思っています。
たとえば、音訳を試してみると、次のようになります。
を使用して
次の出力が得られます。
オンラインの拼音ツールをチェックするのはまったく問題ないようですが、私の問題はICUが文字を1つずつ音訳することです。しかし、私が探しているのは、以下のテキストのようなものです(中国語はわからないので、おそらく以下のテキストは何の意味もありませんが、私が興味を持っている出力の種類を示しているはずです) :
ICU 50は単語のセグメンテーションが可能であると言われましたが、彼らのWebページにもWebにもドキュメントが見つかりませんでした。ICUで単語のセグメンテーションを使用したことがあるか、その方法を知っているか、またはその方法に関する適切なリンクがあるかどうかを知りたいと思いました。
r - アクセント付き文字をアスキー文字に変換する
1600 万の文字列変数のベクトルからドイツ語 (またはフランス語) のアクセントを削除する最適な方法は何ですか?
たとえば、「シェーグレン症候群」を「シェーグレン症候群」に
1 文字から 1 文字への変換は、次のような音訳よりも優れています。
ä => ae ö => oe ü => ue.
たとえば、正規表現を使用することは 1 つのオプションですが、より良い方法 (R パッケージ) はありますか?
gsub('ü','u',gsub('ö','o',"Sjögren's syndrome ( über) "))
R 以外のプラットフォーム用の SO ソリューションはありますが、R には適していません。
php - 変換可能なutf8文字をASCIIと同等に音訳します
この音訳を適切に行うための良い解決策はありますか?
を使ってみましiconv()
たが、とても煩わしく、思ったように動作しません。
- を使用
//TRANSLIT
すると、可能なものを置き換えようとし、すべてを「?」として変換できなくなります。 - 使用
//IGNORE
すると「?」が残りません テキストではありますが、音訳せず、変換不可能E_NOTICE
な文字が見つかった場合にも発生するため、@エラーサプレッサーでiconvを使用する必要があります //IGNORE//TRANSLIT
(PHPフォーラムで提案されているように)使用することは、実際には//IGNORE
(phpバージョン5.3.2および5.3.13で自分で試した)と同じです。- 使用
//TRANSLIT//IGNORE
も同じです//TRANSLIT
また、現在のロケール設定を使用して音訳します。
警告-多くのテキストとコードが続いています!
ここではいくつかの例を示します。
わかりました、それはčćšäöüßéĕěėëȩとæを変換しましたが、なぜđとøではないのですか?
試してみましょう//IGNORE
:
この男のソリューションを使用しても、期待どおりに機能しません:Regular ascii text + YYYYY + aous + eYYYeY + aoY + $ + � + @
PECL intl Normalizerクラスを使用しても(PHP> 5.3.0を使用している場合でも、常に使用できるとは限りません。ICUパッケージintlが使用するPHPは、特定のホスティングサーバーでは使用できない場合があるため)、間違った結果が生成されます。
それで、これを正しく行う他の方法はありますか、または行うべき唯一の適切なことは、音訳テーブルを自分で行うpreg_replace()
か、定義することですか?str_replace()
//付録:2008年のZF wikiの討論で、Zend_Filter_Transliterateの提案について見つけましたが、一部の言語(つまり中国語)では変換できないため、プロジェクトは中止されましたが、ラテン語およびシリルベースの言語IMOではこのオプションが使用されます存在する必要があります。
android - さまざまな携帯電話事業者のウェブサイトに母国語のサポートを追加するにはどうすればよいですか?
Internet Explorer などの Web ブラウザーで母国語 (ヒンディー語、ベンガル語、ウルドゥー語など) をサポートすることは、すでに非常に困難です。しかし、Opera mini や Windows ブラウザなどのモバイル ブラウザでサポートするにはどうすればよいでしょうか。可能な方法がない場合、可能な代替手段は何ですか?