問題タブ [pdf-scraping]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - RでダウンロードしたPDFファイルをスクレイピングする方法
私は最近、インターンシップのためにスクレイピング (および一般的なプログラミング) を始めましたが、PDF スクレイピングに出会いました。スキャンした PDF を R で読み込もうとするたびに、うまく動作しません。file.choose()
関数を使用してみましたが、役に立ちませんでした。ディレクトリを変更する必要がありますか、またはファイルから R に PDF を取得するにはどうすればよいですか? コードは次のようになります。
また、pdftables を使用すると、次のようになります。
node.js - headless が true の場合、操り人形師が PDF ドキュメントに移動する際の問題
puppeteer を使用して PDF ファイルをスクレイピングしようとしています。ボタンをクリックすると、pdf ファイルに移動しますが、puppeteer がレンダリングに失敗するか、pdf ドキュメントに移動できません。応答はヌルです。headless が false の場合、pdf は正常にレンダリングされます。それを解決するのを手伝ってください。headless が true のときに PDF をダウンロードしたい。
クロム/クロムがクラッシュするため、フラグの設定always_open_pdf_externally: true
が機能しませんでした
r - 文字列が特定のシートに存在する場合、TRUE または FALSE で複数の xlsx ファイルに名前を付ける
このコードは xlsx ファイルを読み取り、シート番号と特定の場所 (この場合は temp[2,1]) で見つかった値に基づいて、個別の名前のファイルを作成します。ただし、各ファイルとシートがわずかに異なるため、名前に一貫性がありません。
特定の文字列がシート内のどこかに存在する場合、TRUEまたはFALSEでファイルに名前を付ける方法が欲しいです。この場合は「vivax」です。したがって、この場合:
サンプル ファイル: https://drive.google.com/file/d/1p4HAuFl7Codine1Vvb8SzA7OHTzraaHz/view?usp=sharing