そこで、PDF パーサー ( http://www.pdfparser.org/ ) をインストールしました。私は彼らのウェブサイトをチェックし、デモを使用しました。これにより、私が望んでいた結果が得られました。コンポーザーの使用方法を何時間も検索した後、ようやく機能するようになりました。今、私はデモから結果を得る方法の次の問題に行き詰まっています。
ドキュメントページにあるサンプルコードを使用しました。テキストを抽出しましたが、すべてのテキストが同じ行にあります。デモを使用すると、すべての新しいページが新しい段落で始まり、すべてのテキストが別の行に配置されました。コード:
<?php
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
// Retrieve all pages from the pdf file.
$pages = $pdf->getPages();
// Loop over each page to extract text.
foreach ($pages as $page) {
echo $page->getText();
}
?>
上記のコードを使用したときに述べたように、すべてのテキストを 1 行にまとめました。私の質問は、デモ ページのスクリプトと同じ結果を得るにはどうすればよいですか??