Boilerpipe を使用して、いくつかの Web サイトのニュースページからテキストを抽出したいと考えています。問題は、試行するたびに ConnectionException エラーが発生することです。ボイラーパイプ クイックスタート ガイドの構文例を使用しました。
URL url = new URL("http://www.telegraph.co.uk/news/health/11523739/Nine-in-10-GPs-say-no-to-seven-day-opening.html");
String text = ArticleExtractor.INSTANCE.getText(url);
そして、ここに接続エラーがあります:
de.l3s.boilerpipe.BoilerpipeProcessingException: java.net.ConnectException: Connection refused: connect
at de.l3s.boilerpipe.extractors.ExtractorBase.getText(ExtractorBase.java:89)
at extract.Test.main(Test.java:14)
Caused by: java.net.ConnectException: Connection refused: connect
多くのサイトで試しましたが、同じエラーが発生します。
どうすればこの問題を解決できますか、または少なくとも問題がどこにあるかを確認できますか? (おそらくファイアウォール、またはポート構成...)