PDFファイル(およびおそらく他のファイル)が与えられると、JSoupはファイル全体をダウンロードしてから、コンテンツタイプを調べて解析できないことを確認します。
httpヘッダーを読み取るとすぐに「未処理のコンテンツタイプ」例外がスローされるように、pdfファイル自体のダウンロードを防ぐ方法はありますか?
私の現在のコードは次のようになります。
connection = Jsoup.connect(uri.toString());
Document doc=connection.get();
私が考えることができる唯一の解決策は、ヘッダーを自分で読み取ってからユーザー parseBodyFragment を読み取ることですが、正しい文字セットも計算する必要がある場合、それは大変な作業のように思えます。