r - RでダウンロードしたPDFファイルをスクレイピングする方法

翻译自：https://stackoverflow.com/questions/50749759 2018-06-07T20:33:15.843

4724 次

私は最近、インターンシップのためにスクレイピング (および一般的なプログラミング) を始めましたが、PDF スクレイピングに出会いました。スキャンした PDF を R で読み込もうとするたびに、うまく動作しません。file.choose()関数を使用してみましたが、役に立ちませんでした。ディレクトリを変更する必要がありますか、またはファイルから R に PDF を取得するにはどうすればよいですか? コードは次のようになります。

    > library(pdftools)
    > text=pdf_text("C:/Users/myname/Documents/renewalscan.pdf")
    > text
    [1] ""

また、pdftables を使用すると、次のようになります。

    > library(pdftables)
    > convert_pdf("C:/Users/myname/Documents/renewalscan.pdf","my.csv")
    Error in get_content(input_file, format, api_key) : 
    Bad Request (HTTP 400).

r - RでダウンロードしたPDFファイルをスクレイピングする方法

3 に答える 3

Related

Reference