Linuxサーバーでxpdf(phpを使用)を使用してpdfファイルから情報を抽出しています
一部のファイルではすべて問題ありません
しかし、他のいくつかでは、抽出されたテキストは非常に奇妙です!
Acrobat Reader で PDF を見ると、通常のテキストが表示されます
しかし、抽出すると、たとえば次のようになります。
de? A8HC8 A
QFPY 8 A H
?f de? A8B=8AN Y?N
QFPXgHBHGe BB
また、コンピューターの Windows 8.1 で PDF からメモ帳またはメモ帳 ++ にコピー アンド ペーストすると、これらの奇妙な文字が表示されます。
何か助けてください。よろしく