問題タブ [pdf-scraping]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
4724 参照

r - RでダウンロードしたPDFファイルをスクレイピングする方法

私は最近、インターンシップのためにスクレイピング (および一般的なプログラミング) を始めましたが、PDF スクレイピングに出会いました。スキャンした PDF を R で読み込もうとするたびに、うまく動作しません。file.choose()関数を使用してみましたが、役に立ちませんでした。ディレクトリを変更する必要がありますか、またはファイルから R に PDF を取得するにはどうすればよいですか? コードは次のようになります。

また、pdftables を使用すると、次のようになります。

0 投票する
0 に答える
368 参照

node.js - headless が true の場合、操り人形師が PDF ドキュメントに移動する際の問題

puppeteer を使用して PDF ファイルをスクレイピングしようとしています。ボタンをクリックすると、pdf ファイルに移動しますが、puppeteer がレンダリングに失敗するか、pdf ドキュメントに移動できません。応答はヌルです。headless が false の場合、pdf は正常にレンダリングされます。それを解決するのを手伝ってください。headless が true のときに PDF をダウンロードしたい。

クロム/クロムがクラッシュするため、フラグの設定always_open_pdf_externally: trueが機能しませんでした

0 投票する
1 に答える
48 参照

r - 文字列が特定のシートに存在する場合、TRUE または FALSE で複数の xlsx ファイルに名前を付ける

このコードは xlsx ファイルを読み取り、シート番号と特定の場所 (この場合は temp[2,1]) で見つかった値に基づいて、個別の名前のファイルを作成します。ただし、各ファイルとシートがわずかに異なるため、名前に一貫性がありません。

特定の文字列がシート内のどこかに存在する場合、TRUEまたはFALSEでファイルに名前を付ける方法が欲しいです。この場合は「vivax」です。したがって、この場合:

サンプル ファイル: https://drive.google.com/file/d/1p4HAuFl7Codine1Vvb8SzA7OHTzraaHz/view?usp=sharing