1

Jsoupを使用してHTMLを解析し、PDFURLを取得しています。

PDFは、次の<embed>ようなタグで表示されます。

<html>
<body marginwidth="0" marginheight="0" style="background-color: rgb(38,38,38)">
<embed width="100%" height="100%" name="plugin" src="http://www.domain.com/apdf_id.pdf?tp=&amp;arnumber=1253069&amp;isnumber=28038" type="application/pdf">
</body>
</html>

そのページからPDFURLを取得して、ローカルマシンにダウンロードできるようにするにはどうすればよいですか?

4

1 に答える 1

1

<embed type="application/pdf">要素を選択し、そのsrc属性を絶対URLとして取得するだけです。

String pdfURL = document.select("embed[type=application/pdf").first().absUrl("src");

<embed name="plugin">代わりに具体的に選択することもできます。

String pdfURL = document.select("embed[name=plugin").first().absUrl("src");

java.net.URL次に、のフレーバーでそれを取得するために使用できますInputStream

InputStream input = new URL(pdfURL).openStream();

最後に、通常の方法OutputStreamなどの任意の方法で書き込みます。FileOutputStream

参照:

于 2012-12-21T15:35:33.250 に答える