Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
単語数が正確であることを再確認できるように、ラテックスドキュメント用の簡単な単語カウンターを作成したいと考えています。より一般的には、JavaがPDFファイルからのテキストをとにかく解釈できるかどうかを発見することは有用です。その上のグーグルは何も起こらなかったので、私は多分そうではないと思っていますか?そうでない場合、なぜですか?
PDFファイル リーダーがないと、.pdf からテキストを読み取ることはできません。Java .pdf ライブラリのいくつかを次に示します。
アパッチPDFボックス
iText
PDF Box を使用した Java テキスト抽出の例については、次のリンクも参照してください。