次のようなもの(Scalaコード)を指定して、ダウンロードしたページ/リンクのサイズをJSoupで制限しようとしています:
val document = Jsoup.connect(theURL).get();
特定のページの最初の数 KB だけを取得し、それ以降のダウンロードを停止したいと考えています。非常に大きなページ (またはtheURL
html ではなく、大きなファイルのリンク) がある場合、残りのダウンロードに時間を費やす必要はありません。
私のユースケースは、IRC ボットのページ タイトル スナーファーです。
おまけの質問:
Jsoup.connect(theURL).timeout(3000).get();
大きなファイルでタイムアウトしない理由はありますか? 誰かが終わりのないオーディオ ストリームや大きな ISO などを貼り付けると、ボットが ping アウトする原因になります (別のスレッドで URL タイトルをフェッチする (または Scala アクターを使用してそこでタイムアウトすることで解決できます))。timeout()
同じ最終結果を達成するはずだと思うと、非常に単純なボットにはやり過ぎのように思えます)。