unicode - 非ユニコードからユニコードへの変換、どんなフォントでも！

Question

非 Unicode フォントでエンコードされたテキストを含む html ファイルがあります。そのファイルをユニコードに変換する必要があります。コンバーターを探しました。ただし、ほとんどのコンバーターは、すべてのフォントではなく、フォントのリストに対してのみ機能します。

私のフォントは非常に特殊で、テキストはデーバナーガリー文字です。私はファイルを持っています、私はフォントを持っています、今、私にツールやテクニックを提案してください. ありがとう。

score 5 · Accepted Answer

Unicode はフォントに関するものではなく、エンコーディングに関するものです。テキストを Unicode に変換できるコンバーターを見つける必要があります。あなたのテキストのエンコーディングは何ですか？

score 1 · Accepted Answer

Apache Tikaには、フォントの動作に関する知識を介してPDFファイルからテキストをプルする機能があります。したがって、ファイルが実際にPDFである場合は、チャンスがあります。特定のエンコーディングのないフォントインデックスでいっぱいのテキストファイルがある場合、あなたはあなたの前に大きなプログラミングの仕事を持っています。

unicode - 非ユニコードからユニコードへの変換、どんなフォントでも！

2 に答える 2

Related

Reference