私は最近、インターンシップのためにスクレイピング (および一般的なプログラミング) を始めましたが、PDF スクレイピングに出会いました。スキャンした PDF を R で読み込もうとするたびに、うまく動作しません。file.choose()
関数を使用してみましたが、役に立ちませんでした。ディレクトリを変更する必要がありますか、またはファイルから R に PDF を取得するにはどうすればよいですか? コードは次のようになります。
> library(pdftools)
> text=pdf_text("C:/Users/myname/Documents/renewalscan.pdf")
> text
[1] ""
また、pdftables を使用すると、次のようになります。
> library(pdftables)
> convert_pdf("C:/Users/myname/Documents/renewalscan.pdf","my.csv")
Error in get_content(input_file, format, api_key) :
Bad Request (HTTP 400).