1

私はURLを持っています:http://pasca.undiksha.ac.id/e-journal/index.php/jurnal_bahasa/article/view/500(pdfに直接アクセスするのではなく、pdfファイルに送信されます。このpdfを解析したいファイルを作成してPDFテキストを取得します。jsoupを使用してみます: `

String url = "http://pasca.undiksha.ac.id/e-journal/index.php/jurnal_ep/article/download/380/172";
File in = new File(url);
Document doc = Jsoup.parse(in, "UTF-8");
System.out.println(doc.toString());`

出力は次のとおりです。

java.io.FileNotFoundException: http:\pasca.undiksha.ac.id\e-journal\index.php\jurnal_ep\article\download\380\172 (The filename, directory name, or volume label syntax is incorrect)
        at java.io.FileInputStream.open(Native Method)
        at java.io.FileInputStream.<init>(FileInputStream.java:138)
        at org.jsoup.helper.DataUtil.load(DataUtil.java:36)
        at org.jsoup.Jsoup.parse(Jsoup.java:103)

何か考えがありますか?ありがとう

4

2 に答える 2

3

URLConnection を使用して、次を使用して pdf の読み取りコンテンツを接続します。

URL url = 
new URL( "http://pasca.undiksha.ac.id/e-journal/index.php/jurnal_bahasa/article/view/500" );

URLConnection connection = url.openConnection();

input = connection.getInputStream();

Document doc = Jsoup.parse(in, "UTF-8");
System.out.println(doc.toString());
于 2013-01-29T08:15:40.413 に答える
0

File以外のURLではもちろん使えませんfile://、もちろんエラーになります。commons-http-clientを使用して、Web 上のファイルにアクセスします。

于 2013-01-29T08:16:32.017 に答える