次のように機能するシステムがあります。
- PDFファイルは、mPDFライブラリを使用してサーバー上で生成されます。
- ユーザーはブラウザで生成されたPDFファイルを見て、EMFファイルを作成する仮想プリンターに印刷することがあります。
- テキスト情報を抽出するために分析されたEMFファイル。
- 抽出されたテキスト情報はさらに処理されます。
このプロセスの私の部分は、EMFファイルからテキスト情報を抽出することです。また、EMFファイルにテキスト情報が含まれている場合、私のアルゴリズムは正常に機能します。ただし、PDFファイルを仮想プリンターに印刷すると、印刷ソフトウェアによってテキスト情報の一部が線や曲線に置き換えられるため、EMFからテキスト情報を抽出できなくなります。
私はこの問題を何度も調査し、印刷されたすべてのPDFに共通の解決策はないと結論付けました。しかし同時に、印刷ソフトウェアが、埋め込まれたOpenTypeフォントを使用するテキストの部分のみを置き換えることを発見しました。
したがって、この特定のケースでは、埋め込みOpenTypeフォントを使用しないようにmPDFを構成できれば、問題は解決されます。
私の質問は、埋め込みOpenTypeフォントを使用しない方法でmPDFを構成できるかどうかです。