0

私はxpdfを使用してpdfファイルをテキストに変換しています。以下はそれに使用されるコードです。

$content = shell_exec('pdftotext '.$filename.' -');

Xpdfは、PDF内のいくつかの特別なフォントをテキストに変換することはできません。例:xpdfを使用して奇妙なフォントをテキストに変換することはできません。

それらは、PDFのすべての種類のフォントをPHPのテキストに変換できる代替ソフトウェアですか。

4

1 に答える 1

0

XPDFバージョンがファイルで失敗した場合は、 Popplerバージョンを試してみてください。pdftotext

ただし、この事実に注意してください 。AcrobatReaderでさえ、PDFページで適切にレンダリングされたテキストのすべてのケースをテキストファイルに抽出できるわけではありません...

于 2012-07-29T16:37:44.233 に答える