0

Boilerpipe を使用して、いくつかの Web サイトのニュースページからテキストを抽出したいと考えています。問題は、試行するたびに ConnectionException エラーが発生することです。ボイラーパイプ クイックスタート ガイドの構文例を使用しました。

URL url = new URL("http://www.telegraph.co.uk/news/health/11523739/Nine-in-10-GPs-say-no-to-seven-day-opening.html");
String text = ArticleExtractor.INSTANCE.getText(url);

そして、ここに接続エラーがあります:

de.l3s.boilerpipe.BoilerpipeProcessingException: java.net.ConnectException: Connection refused: connect
   at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:89)
   at extract.Test.main(Test.java:14)
Caused by: java.net.ConnectException: Connection refused: connect

多くのサイトで試しましたが、同じエラーが発生します。

どうすればこの問題を解決できますか、または少なくとも問題がどこにあるかを確認できますか? (おそらくファイアウォール、またはポート構成...)

4

1 に答える 1

0

さらに調査した結果、これらの要求をブロックしたのは企業内のファイアウォールであることがわかりました。

于 2015-04-09T13:01:03.707 に答える