問題タブ [devanagari]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
6728 参照

python - デーバナーガリー文字の組み合わせ

私は次のようなものを持っています

私は次のようなことを達成したい

しかし、मは4バイトかかりますが、बिは8バイトかかるので、私はそれをまっすぐに行うことができません。では、それを達成するために何ができるでしょうか?Pythonで。

0 投票する
2 に答える
423 参照

nlp - デバナーガリック テキスト処理 (NLP) をどこから始めるか

私は Devnagaric NLP を初めて使用します。Devnagaric 言語 (主にネパール語またはヒンディー語などの類似言語) で NLP を開始するのに役立つグループまたはリソースはありますか? Devanagaric 用のフォントを開発したり、フォント処理アプリケーションを実行したりしたいと考えています。誰か(この分野で働いている)が私にアドバイスをくれるとしたら、それは非常にありがたいことです. 前もって感謝します

0 投票する
2 に答える
739 参照

python - PyGame でデバナーガリー テキストが正しくレンダリングされない

ネイティブに変換したい小さな Web アプリがあります。現在、多くの可動部分 (バックエンド、ブラウザーなど) があり、それを 1 つの緊密なアプリケーションに変換したいと考えています。これを行うために PyGame を使用することにしましたが、フォントのレンダリングの問題を除けば、これまでのところ問題ありません。

表示したい文字列は कोझिकोड です。これは、正しくレンダリングされて次のようになります正しくレンダリング

特定のコード ポイントは \u0915 \u094b \u091d \u093f \u0915 \u094b および \u0921 です。

これで、エディターとブラウザーでは問題ないように見えますが、PyGame でレンダリングしようとすると、これが表示されます間違ってレンダリング。基本的に、母音記号 (\u093f ि) は झ の左側にあるはずですが、右側 (および क の左側) に表示されるため、完全に混乱しています。これはブラウザーやテキスト エディター (入力文字列が同じ) では発生しないため、PyGame のレンダラーの問題であると推測しています。

ि (\u093f) を झ (\u091d) の前に置くという、この特定のケースでのみ機能する大まかな修正が 1 つあります。その場合、そうのように適切にレンダリングされます大雑把な修正。これは、私が言語についてある程度知っていて、そのロジックをコードに組み込んでいることにかかっています。ここでは複数の言語を扱わなければならないので、それは現実的ではありません。

私はユニコードの経験があまりないので、この問題に取り組む方法がわかりません。これを修正するためにできることはありますか?

念のため、Debian にあり、これをレンダリングするために必要なグリフを備えたfreesansフォントを使用しています。

更新: これを実際にレンダリングするコードは次のとおりです。

これはそれがどのように見えるかですレンダリング エラー

最初の単語は正しくレンダリングされていますが、大雑把な修正で述べたように、母音と文字の位置を反転させてレンダリングしています。2 番目は適切に記述されていますが、正しくレンダリングされていません。

更新 2 : 他に何もないので、外部プログラムを使用して文字列を画像にレンダリングし、この画像を PyGame サーフェスにブリットすることにしました。imagemagick を試してみましたが、これと同じように混乱してしまいます。Gimp は問題なく動作するので、バッチ モードを使用して作業を完了する予定です。