問題タブ [pdf-scraping]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

137 問題

0 投票する

3 に答える

4724 参照

r - RでダウンロードしたPDFファイルをスクレイピングする方法

私は最近、インターンシップのためにスクレイピング (および一般的なプログラミング) を始めましたが、PDF スクレイピングに出会いました。スキャンした PDF を R で読み込もうとするたびに、うまく動作しません。file.choose()関数を使用してみましたが、役に立ちませんでした。ディレクトリを変更する必要がありますか、またはファイルから R に PDF を取得するにはどうすればよいですか? コードは次のようになります。

また、pdftables を使用すると、次のようになります。

r pdf-scraping

2018-06-07T20:33:15.843

0 投票する

0 に答える

368 参照

node.js - headless が true の場合、操り人形師が PDF ドキュメントに移動する際の問題

puppeteer を使用して PDF ファイルをスクレイピングしようとしています。ボタンをクリックすると、pdf ファイルに移動しますが、puppeteer がレンダリングに失敗するか、pdf ドキュメントに移動できません。応答はヌルです。headless が false の場合、pdf は正常にレンダリングされます。それを解決するのを手伝ってください。headless が true のときに PDF をダウンロードしたい。

クロム/クロムがクラッシュするため、フラグの設定always_open_pdf_externally: trueが機能しませんでした

2018-06-22T03:30:25.443

0 投票する

1 に答える

48 参照

r - 文字列が特定のシートに存在する場合、TRUE または FALSE で複数の xlsx ファイルに名前を付ける

このコードは xlsx ファイルを読み取り、シート番号と特定の場所 (この場合は temp[2,1]) で見つかった値に基づいて、個別の名前のファイルを作成します。ただし、各ファイルとシートがわずかに異なるため、名前に一貫性がありません。

特定の文字列がシート内のどこかに存在する場合、TRUEまたはFALSEでファイルに名前を付ける方法が欲しいです。この場合は「vivax」です。したがって、この場合：

サンプルファイル: https://drive.google.com/file/d/1p4HAuFl7Codine1Vvb8SzA7OHTzraaHz/view?usp=sharing

r xlsx pdf-scraping

2018-10-18T15:51:45.957

1 2 3 4 5 6 7 8 9 10

問題タブ [pdf-scraping]

r - RでダウンロードしたPDFファイルをスクレイピングする方法

node.js - headless が true の場合、操り人形師が PDF ドキュメントに移動する際の問題

r - 文字列が特定のシートに存在する場合、TRUE または FALSE で複数の xlsx ファイルに名前を付ける

Reference