java - Javaを使用してPDFから著者の詳細を抽出する方法

Question

私は何千ものPDF記事を持っており、そこから著者名と、PDF内に提供されているものaddressなどの関連する詳細のみを抽出する必要がありemail IDます(内部のコンテンツを意味します)。PDFのメタデータに関連付けられた詳細を取得して、これを行いたくありません。私はそれを試したので、著者名、タイトル、およびまったく必要のないその他の通常の詳細などの詳細が少なくなりました。

私はインターネットのすべての API を使用しましたが、それでも解決策は得られました。Javaで行う必要があります。

score 1 · Accepted Answer

ライブラリから直接取得することはできないと思います。PDFを読むためにiTestライブラリを使用してください。テキストが読めるようになったら、正規表現を使用して作成者を見つけます。

java - Javaを使用してPDFから著者の詳細を抽出する方法

1 に答える 1

Related

Reference