問題タブ [transliteration]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - array_flip()およびutf8
私は配列(18キー)を持っています:
これらのキーはリトアニア語の記号(utf8エンコーディング)です。私が$lt = array_flip($en);
それをするとき、それは以下を返します:
ご覧のとおり、4つのキーがありません(「Ę」、「Ų」、「ę」、「ų」)。何が起きてる?
c# - for c#ループでスタックしました!
devanagriからitransへのマッピングを持つ2つのxmlファイルがあります。これらのファイルはdev.xmlとgujarati.xmlです。xmlファイルの内容は次のとおりです。
guj.xmlの場合は次のとおりです。
dev.xmlの場合は
次のコードを持つglobal.asaxファイルがあります。
ここでのコードは、両方のxmlファイルから読み取り、文字を2次元配列に格納します。この配列は、default.aspxでアクセスできるように、セッション変数にさらに格納されます。
default.aspxファイルには次のコードが含まれています。
ここで、intranscontentには、div要素を持つWebページが含まれています。だから私はそれらからテキストノードを選択します。このコードでは、global.asaxにあったセッション変数にアクセスしているため、ノードは文字列に変換されてからchararrayに変換され、devanagriの文字をグジャラート語に置き換えることができます。
forループでは、すべての音訳規則を念頭に置いて、すべてのdevanagri文字と同等のグジャラート語文字をチェックする必要があります。音訳規則は、前の文字が母音の場合、母音のみを出力する必要があるようなものです。誰かがこのforループを手伝ってくれるなら、私は彼らに感謝するでしょう。ありがとう!質問は自由に投稿できます。
java - icu4j キリル文字からラテン文字へ
URLにキリル文字を含めることができるように、キリル文字をラテン語にしようとしています。私はicu4j 文字変換を使用していますが、それでもVilândimaaのような奇妙な文字が表示されます。もっとviljandimaaに似ているはずです。その URL をコピーすると、これらの文字は %.. に変わります。
icu4j でキリル文字を az に変換する方法を知っている人はいますか?
アップデート
まだ自分自身に答えることはできませんが、非常に役立つこの質問を見つけました: Converting Symbols, Accent Letters to English Alphabet
unicode - ICUでラテン語⇔漢語変換?
C++ プログラムで ICU4C を使用して ICU 変換を実装し始めたところです。私は特に中国語への、または中国語からの音訳に注目しています。
このドキュメントによると、パッケージは「Han-Latin」と「Latin-Han」の両方の変換をサポートしています。ラテン語から漢語への変換は、高度な統計技術なしでは特に難しいため、中国語の学生としては、これは驚くべきことのように思えます (私が見た中で最も近いのは Google Transliterate で、ユーザー入力がなくても実際にこれで素晴らしい仕事をします.しかし、これは現在のプロジェクトでは実現不可能です)、声調記号なしの変換はなおさらです。比尔·莫瑞のような事実上の外国の名前の借用文字に頼ることなく、これが可能であることに私は懐疑的です. この論文(PDF)でわかるように、これは Google マップが国際的なドメインで採用しているアプローチです。
とにかく、私は信じられないことを喜んで保留し、ドキュメントとチュートリアルを参照した後、2 つの Transliterator オブジェクト (to と from) を構築し、それらを使用して簡単な音訳を実行することができました。
Han-Latin はまずまずに機能しましたが (単純なデータで約 80% の精度)、Latin-Han はまったく機能していないようで、入力されたものと同じ「ラテン」文字列を返しました。これは、オンライン変換を使用して得た結果と一致しています。サンプルであり、私が中国語について知っていることと一致しています。ここでわかるように、私はこのテーブルを見つけることができました。これは両方のソースに使用されていると思います:
これは、ピンイン文字列を指定すると、元の文字列を再現できる可能性があることを意味していると思いますが、そうではないようです。
私の一般的な質問は次のとおりだと思います。この種の変換は、ICU や Google Transliterate 以外でも可能ですか? 期待される出力は何ですか?関連して、ICUが実際にサポートしているスクリプト ペアのリストがどこかにありますか (これが本当に可能でない場合)。
お時間をいただきありがとうございます
php - 特殊文字をその表音的な類似文字に置き換えます (php - utf8)
è や é のような文字がたくさんあることはご存知でしょう。ö,ä,ì,á,ù など、他にもたくさんあります。
これらの文字を「表音のパートナー」文字に置き換えたいのですが、次のような単一の文字ごとに実行したくありません
次のようなことを行う一般的な方法はありますか:
- すべてのケースをカバーするスクリプトを作成した人はいますか?
- これらの文字を自動的に検出して ` または ' を削除する方法はありますか?
今までありがとう
アップデート:
誰かがこれをお勧めしますか(php.netにあります)?
c# - C#のヒンディー語テキストから英語の音訳
ヒンディー語のテキストを英語の音訳に変換するために使用できる ac# コードを探しています。
また、C# で使用できる API があれば教えてください。
javascript - リッチテキストエディタでのGoogleの音訳
リッチテキスト編集サポートと一緒にGoogle音訳を使用する必要があります。
Google Transliteration APIドキュメントでは、 ClosureライブラリまたはYahoo!が提供するリッチテキストエディタを推奨しています。UIライブラリ。
しかし、両方を試しましたが、音訳が機能しません。
文字変換もサポートするリッチテキストエディタを実装した人はいますか?
[編集:回答は以下で更新されました]
api - Firefox での Google 音訳 API の問題
Firefox 4.0.1 および WindowsXP で Google Transliterate API helloWorld を使用しようとしています。
ページを提供するためにnode.js 0.4.7を使用しています
node.js を介してページを読み込むと、次のエラーが表示されます:「クリアされたスコープでコンパイル アンド ゴー スクリプトを実行しようとしています」
ページをダブルクリックしてディスクから Firefox で開くか、IE8、Opera、または Chrome で開くと、ページは正常にレンダリングされます。
なぜこれが起こるのか、それを回避する方法は何ですか? コードは次のとおりです。
asp.net - Unicode 数字を英語からデバナーガリ文字に変換する
RegEx またはその他の方法で、0 ~ 9 の数字を ०-९ (デーバナーガリー スクリプト) に変換する方法を探していました。私はasp.netを使用していますが、これを行うグローバリゼーション名前空間にメソッドが見つかりませんでした。
どんな助けでも大歓迎です。