問題タブ [pdftools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - HTMLのhrefリンクからビットストリームのURLにたどり着く方法
rvest
R
パッケージを使用してこのexposed url
Web ページから PDF ファイルをスクレイピングしていますが、 by nameをクリックすると、最終的なリンクが (ビットストリーム URL として - それが何であれ) 公開されますAC1-96-21-01-2011.pdf
。最終的な pdf ファイルは、アクセスできないようにここに隠れています。これにより、前のリンク ( ) をクリックしたときにのみ最終的な pdf ファイルが開くため、rvest
関数のすべての試行がブロックされます。PDFファイルに入力できないものをコピーして貼り付けます。read_html()
href
xml node
href
最終的なファイルは、ノード
で公開されていないこの URL にあります。http://judgmenthck.kar.nic.in/judgments/bitstream/123456789/563560/2/AC1-96-21-01-2011.pdf
要約すると、上記で説明した属性にrvest
ないものを使用してpdfファイルリンクにアクセスするにはどうすればよいですか。href
検索しようとしましbitstream
たが、別の場所に移動します。