0

rvest Rパッケージを使用してこのexposed urlWeb ページから PDF ファイルをスクレイピングしていますが、 by nameをクリックすると、最終的なリンクが (ビットストリーム URL として - それが何であれ) 公開されますAC1-96-21-01-2011.pdf。最終的な pdf ファイルは、アクセスできないようにここに隠れています。これにより、前のリンク ( ) をクリックしたときにのみ最終的な pdf ファイルが開くため、rvest関数のすべての試行がブロックされます。PDFファイルに入力できないものをコピーして貼り付けます。read_html()hrefxml node

<a href="/judgments/handle/123456789/701">Arbitration Case - AC</a>

href最終的なファイルは、ノード で公開されていないこの URL にあります。http://judgmenthck.kar.nic.in/judgments/bitstream/123456789/563560/2/AC1-96-21-01-2011.pdf

要約すると、上記で説明した属性にrvestないものを使用してpdfファイルリンクにアクセスするにはどうすればよいですか。href

検索しようとしましbitstreamたが、別の場所に移動します。

4

1 に答える 1