問題タブ [ligature]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
410 参照

java - 正規表現を使用した Unicode テキストの検索

Hindi(Devanagri) (UTF-16) で記述されたファイルを検索すると、以下の問題が発生しました。

ファイルには次が含まれます。

तरास ततत जुग नींद ना हा बु

最初の文字 'तर' は त + ् + र の複数のコード ポイントであることに注意してください。'त' を検索すると、最初の文字の त を含む 4 つの一致が得られます。私はJavaを使用しています。

複数のコード ポイント文字の一部ではない「त」を検索するにはどうすればよいですか。

どんな助けでも大歓迎です。:)

0 投票する
5 に答える
1945 参照

java - Clojure/Java での Unicode テキスト合字の検出

0 投票する
1 に答える
8441 参照

unicode - どのLaTeXコマンドがemdashを作成しますか?

---でem-dash (および)でen-dashを作成できることはわかっています--。ただし、Unicodeセットアップでこれらのグリフを使用し、次のように試します。

出力に2つまたは3つのダッシュのシリーズを生成するだけです。代わりに何を使用すればよいですか?\endashと試し\ndashましたが、それらは既知のコマンドではありません。

0 投票する
2 に答える
3761 参照

html - Google FontAPIの合字をGoogleChromeで表示するにはどうすればよいですか?

ウェブサイトのロゴを表示するためにGoogleFontAPIを使用しています。(stolencamerafinder.comの上部を参照してください)

Chromeでは、文字「f」と「i」は別々に表示されますが、FireFoxでは、これらは結合された合字です。

Chromeに合字を使用させるにはどうすればよいですか?

HTMLで合字ASCII文字(?)を使用すると、フォントは使用されず、arialにフォールバックしますが、Firefoxが表示するため、フォント(OFL Sorts Mill Goudy TT)はその合字をサポートする必要があります。

更新:私は結局、プレーンな@font-faceを支持してGoogleフォントAPIを捨てました。とにかくfontsquirrel.comでより多くの選択肢。

0 投票する
4 に答える
2477 参照

java - MacOSXのJavaSwingJComponentでデーバナーガリー合字(Unicode)をレンダリングする

Mac OS X 10.6でデーバナーガリー合字(Unicode文字列)を正しくレンダリングしようとしています。

文字列はに描画され、JComponentアンチエイリアスにRenderingHints使用されます。結紮はWindowsXPSP2と7、およびUbuntuで正しく表示されますが、Mac OS Xでは、結紮は分解され(つまり、正しくマージされません)、ダイアクリティックはそれらの位置から移動されます(以下のスクリーンショットを参照)。左側のWinXPSP2からの正しいレンダリング例(RenderingHintsアンチエイリアスキーをON使用)、右側のMac OS X 10.6.7からの間違ったレンダリング例(Antialising DEFAULT= OFF)。

フォントを次のように設定したので、どのシステムでもデフォルトのフォントを使用する必要があります。

これはすべて、Macのデフォルトの文字エンコードがMacRoman(UTF-8サブセットではない)であり、他のシステム(Windowsなど)がUTF-8サブセット(WinLatin-1など)を使用しているという事実と関係があると思います。 )またはcp1252など。

この情報が手元にあるとしても、私はこの問題をどのように処理するかについて暗闇に包まれています。したがって、誰かが私を正しい方向に向けることができれば、私は非常にありがたいです。

同じ文字列の正しいレンダリングと正しくないレンダリング

私はすでにいくつかのことを試しました:

  • フォントをデーバナーガリーMTに設定しても、問題は解決しませんでした
  • TextAttribute LIGATURES_ON問題を解決しなかった

他の開発者(できれば、Macで開発するヒンディー語のバックグラウンドを持つ)によるヒントやコードスニペットに非常に感謝します。

0 投票する
3 に答える
5163 参照

java - Unicode 合字文字の分離

膨大な数の Unicode 文字の中で、2 つの 'f' 文字を表す U+FB00 合字 ff のように、実際には複数の文字を表すものがあります。このような文字を複数の単一文字に簡単に変換する方法はありますか? 標準の Java API で利用できるものが望ましいですが、必要に応じて外部ライブラリを参照することもできます。

0 投票する
1 に答える
433 参照

javascript - HTML5Canvasの2つのフォントの比較

特定の文字が指定されたスタイルのフォントで表示されているのか、システムのデフォルトのフォントで表示されているのかをチェックするツールをまとめようとしています。私の最終的な目標は、少なくとも最新の(IE8 +を読む)ブラウザーで、特定のフォントでリガチャーがサポートされているかどうかを確認できるようにすることです。

同じ合字(この場合はst)を表示する2つのキャンバスがあります。それらのキャンバスをデータに変換し、それらを比較して、文字が一致するかどうかを確認します。

Arial(ほとんどのフォントと同様)には合字がないため、デフォルトのセリフフォントにフォールバックします。ここが奇妙なところです。同じフォントを表示していますが、2つのキャンバスには同じデータがありません。

なんで?キャンバス上のそれらの位置は完全に同じではないからです。フォントの相対的な高さの違いに関係していると思います(一方はもう一方より少し高いですが、フォントごとに異なります)。違いは1ピクセルか2ピクセルのようで、フォントごとに異なります。

これをどのように解決することができますか?私の現在の唯一のアイデアは、フォントの高さを測定し、それに応じてその位置を調整する方法を見つけることですが、残念ながら、それを行う方法がわかりません。2つの画像を同一にするために私が取るかもしれない他のアプローチはありますか?

以下のコードを見ることができます。両方のキャンバスが正常に初期化され、要素の本体に追加されているため、何が起こっているかを視覚的に確認できます(ただし、実際に作業しているスクリプトでは必要ありません)。初期化とコンテキストはすべて正常に機能しているため、削除しました。

0 投票する
1 に答える
318 参照

itext - iText を使用すると、チベット語とデバナーガリー語の合字が正しくスタックされない

iText-2.1.7 と iText-5.1.3 の両方を使用して、Unicode テキストを出力しようとしました。

デーバナーガリー文字は正しくスタックされましたが、チベット文字は正しくスタックされていません。

代わりに、各キャラクターは別々のスペースを占めています。ARIALUNI.TTF と TibMachUni-1.901b.ttf の両方で BaseFonts を試しましたが、成功しませんでした。

グーグルは2009年の投稿を私に与えました。

Unicode プロジェクトの途中で立ち往生しています。続行するための手がかりをいただければ幸いです。

0 投票する
1 に答える
2535 参照

python - 16 進文字 (合字) を utf-8 文字に変換します

0 投票する
1 に答える
732 参照

java - Java(およびその他)で「FI」の合字を決定する方法

PDF ファイルを解析し、インデックス作成などのために内部のテキストを引き出すシステムがあります。私たちが抱えている問題の 1 つは、Illustrator が「fi」を含む単語を設定して、fi (単一グリフ) の合字を使用することです。

たとえば、この行...

「ベンチと豊かなガラス化セラミック タイル」。

私のJavaデバッガーではこのように表示されます

「エテ ベンチとリッチ ビトリ\u001Fed セラミック タイル。」

\u001F は、Adobe PDF ファイルが合字「fi」に使用する文字コードのようです。\u001F の出現を「fi」に置き換えることは明らかにできますが、これとそのようなケースを処理する堅牢な方法を知っている人はいますか?