0

そこで、PDF パーサー ( http://www.pdfparser.org/ ) をインストールしました。私は彼らのウェブサイトをチェックし、デモを使用しました。これにより、私が望んでいた結果が得られました。コンポーザーの使用方法を何時間も検索した後、ようやく機能するようになりました。今、私はデモから結果を得る方法の次の問題に行き詰まっています。

ドキュメントページにあるサンプルコードを使用しました。テキストを抽出しましたが、すべてのテキストが同じ行にあります。デモを使用すると、すべての新しいページが新しい段落で始まり、すべてのテキストが別の行に配置されました。コード:

<?php

// Include Composer autoloader if not already done.
include 'vendor/autoload.php';

// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

// Retrieve all pages from the pdf file.
$pages  = $pdf->getPages();

// Loop over each page to extract text.
foreach ($pages as $page) {
    echo $page->getText();
}

?>

上記のコードを使用したときに述べたように、すべてのテキストを 1 行にまとめました。私の質問は、デモ ページのスクリプトと同じ結果を得るにはどうすればよいですか??

4

1 に答える 1