rvest
R
パッケージを使用してこのexposed url
Web ページから PDF ファイルをスクレイピングしていますが、 by nameをクリックすると、最終的なリンクが (ビットストリーム URL として - それが何であれ) 公開されますAC1-96-21-01-2011.pdf
。最終的な pdf ファイルは、アクセスできないようにここに隠れています。これにより、前のリンク ( ) をクリックしたときにのみ最終的な pdf ファイルが開くため、rvest
関数のすべての試行がブロックされます。PDFファイルに入力できないものをコピーして貼り付けます。read_html()
href
xml node
<a href="/judgments/handle/123456789/701">Arbitration Case - AC</a>
href
最終的なファイルは、ノード
で公開されていないこの URL にあります。http://judgmenthck.kar.nic.in/judgments/bitstream/123456789/563560/2/AC1-96-21-01-2011.pdf
要約すると、上記で説明した属性にrvest
ないものを使用してpdfファイルリンクにアクセスするにはどうすればよいですか。href
検索しようとしましbitstream
たが、別の場所に移動します。