-1

非 Unicode フォントでエンコードされたテキストを含む html ファイルがあります。そのファイルをユニコードに変換する必要があります。コンバーターを探しました。ただし、ほとんどのコンバーターは、すべてのフォントではなく、フォントのリストに対してのみ機能します。

私のフォントは非常に特殊で、テキストはデーバナーガリー文字です。私はファイルを持っています、私はフォントを持っています、今、私にツールやテクニックを提案してください. ありがとう。

4

2 に答える 2

5

Unicode はフォントに関するものではなく、エンコーディングに関するものです。テキストを Unicode に変換できるコンバーターを見つける必要があります。あなたのテキストのエンコーディングは何ですか?

于 2011-03-02T19:03:48.207 に答える
1

Apache Tikaには、フォントの動作に関する知識を介してPDFファイルからテキストをプルする機能があります。したがって、ファイルが実際にPDFである場合は、チャンスがあります。特定のエンコーディングのないフォントインデックスでいっぱいのテキストファイルがある場合、あなたはあなたの前に大きなプログラミングの仕事を持っています。

于 2011-03-02T19:08:45.123 に答える