PDF からテキストを抽出するためのライブラリ (可能であれば Java または PHP で利用可能) を探しています。次のような多くのソフトウェアが利用可能です。
3-Heights™ PDF 抽出http://www.pdf-tools.com/pdf/pdf-extract-content-metadata-text.aspx
PDFlib TET – テキスト抽出ツールキットhttp://www.pdflib.com/products/tet/
どのツールを選択しますか? それらについてどう思いますか?
ご親切にありがとうございました。