1

PDFファイル(およびおそらく他のファイル)が与えられると、JSoupはファイル全体をダウンロードしてから、コンテンツタイプを調べて解析できないことを確認します。

httpヘッダーを読み取るとすぐに「未処理のコンテンツタイプ」例外がスローされるように、pdfファイル自体のダウンロードを防ぐ方法はありますか?

私の現在のコードは次のようになります。

        connection = Jsoup.connect(uri.toString());
        Document doc=connection.get();

私が考えることができる唯一の解決策は、ヘッダーを自分で読み取ってからユーザー parseBodyFragment を読み取ることですが、正しい文字セットも計算する必要がある場合、それは大変な作業のように思えます。

4

1 に答える 1

1

はい、1.6.4-Pending をダウンロードすると、その問題は解決しました。

于 2012-07-24T06:29:25.210 に答える