PDF コンテンツは、"(abc) Tj"、"(<0035><0035>) Tj"、または "\u065" といういくつかの方法で保存されます。
直接テキスト「(abc) Tj」、16 進数「(<0035><0035>) Tj」、または 8 進数「\u065」に関係なく、PDF コードを 1 つのタイプに変換する方法があるかどうかを知りたいです。
PDF を 1 つのタイプに変換してエンコードすると、コンテンツの分析が容易になると思います。
Ghostscriptなどを使用してそれを行うことは可能ですか? ありがとう