問題タブ [devanagari]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - デーバナーガリー文字の組み合わせ
私は次のようなものを持っています
私は次のようなことを達成したい
しかし、मは4バイトかかりますが、बिは8バイトかかるので、私はそれをまっすぐに行うことができません。では、それを達成するために何ができるでしょうか?Pythonで。
nlp - デバナーガリック テキスト処理 (NLP) をどこから始めるか
私は Devnagaric NLP を初めて使用します。Devnagaric 言語 (主にネパール語またはヒンディー語などの類似言語) で NLP を開始するのに役立つグループまたはリソースはありますか? Devanagaric 用のフォントを開発したり、フォント処理アプリケーションを実行したりしたいと考えています。誰か(この分野で働いている)が私にアドバイスをくれるとしたら、それは非常にありがたいことです. 前もって感謝します
python - PyGame でデバナーガリー テキストが正しくレンダリングされない
ネイティブに変換したい小さな Web アプリがあります。現在、多くの可動部分 (バックエンド、ブラウザーなど) があり、それを 1 つの緊密なアプリケーションに変換したいと考えています。これを行うために PyGame を使用することにしましたが、フォントのレンダリングの問題を除けば、これまでのところ問題ありません。
表示したい文字列は कोझिकोड です。これは、正しくレンダリングされて次のようになります。
特定のコード ポイントは \u0915 \u094b \u091d \u093f \u0915 \u094b および \u0921 です。
これで、エディターとブラウザーでは問題ないように見えますが、PyGame でレンダリングしようとすると、これが表示されます。基本的に、母音記号 (\u093f ि) は झ の左側にあるはずですが、右側 (および क の左側) に表示されるため、完全に混乱しています。これはブラウザーやテキスト エディター (入力文字列が同じ) では発生しないため、PyGame のレンダラーの問題であると推測しています。
ि (\u093f) を झ (\u091d) の前に置くという、この特定のケースでのみ機能する大まかな修正が 1 つあります。その場合、そうのように適切にレンダリングされます。これは、私が言語についてある程度知っていて、そのロジックをコードに組み込んでいることにかかっています。ここでは複数の言語を扱わなければならないので、それは現実的ではありません。
私はユニコードの経験があまりないので、この問題に取り組む方法がわかりません。これを修正するためにできることはありますか?
念のため、Debian にあり、これをレンダリングするために必要なグリフを備えたfreesansフォントを使用しています。
更新: これを実際にレンダリングするコードは次のとおりです。
最初の単語は正しくレンダリングされていますが、大雑把な修正で述べたように、母音と文字の位置を反転させてレンダリングしています。2 番目は適切に記述されていますが、正しくレンダリングされていません。
更新 2 : 他に何もないので、外部プログラムを使用して文字列を画像にレンダリングし、この画像を PyGame サーフェスにブリットすることにしました。imagemagick を試してみましたが、これと同じように混乱してしまいます。Gimp は問題なく動作するので、バッチ モードを使用して作業を完了する予定です。