問題タブ [pdftools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
57 参照

r - HTMLのhrefリンクからビットストリームのURLにたどり着く方法

rvest Rパッケージを使用してこのexposed urlWeb ページから PDF ファイルをスクレイピングしていますが、 by nameをクリックすると、最終的なリンクが (ビットストリーム URL として - それが何であれ) 公開されますAC1-96-21-01-2011.pdf。最終的な pdf ファイルは、アクセスできないようにここに隠れています。これにより、前のリンク ( ) をクリックしたときにのみ最終的な pdf ファイルが開くため、rvest関数のすべての試行がブロックされます。PDFファイルに入力できないものをコピーして貼り付けます。read_html()hrefxml node

href最終的なファイルは、ノード で公開されていないこの URL にあります。http://judgmenthck.kar.nic.in/judgments/bitstream/123456789/563560/2/AC1-96-21-01-2011.pdf

要約すると、上記で説明した属性にrvestないものを使用してpdfファイルリンクにアクセスするにはどうすればよいですか。href

検索しようとしましbitstreamたが、別の場所に移動します。