Webページからメインのニュースコンテンツを抽出する必要があります。インターネットで検索したところ、その目的で無料で利用できるBoilerpipeという名前のAPIが見つかりました。http://boilerpipe-web.appspot.com/しかし、で実装を見つけることができません。 Boilerpipeを利用するJava。JavaでBoilerpipeを使用してニュースコンテンツを抽出する方法や、Boilerpipeを使用してニュースWebページからコンテンツを抽出するJavaの実装へのリンクを教えてもらえますか?
質問する
1929 次
2 に答える
1
私の答えは遅すぎるかもしれません。しかし、それはかなり単純です。
URL url = new URL("http://www.nydailynews.com/sports/baseball");
ArticleExtractor ae = new ArticleExtractor();
String content = ae.getText(url); // this contains the final text
于 2012-06-22T13:27:32.130 に答える
0
簡単ですね。このURLを抽出する必要があるとします。
私の BoilerPipe 代替 Web API HEREを使用してください。私のサービスはボイラーパイプに基づいています。元のアプリケーションで割り当て超過エラーが発生したため、これを開発しました。JSON で結果を取得するオプションがあり、アプリケーションでそれを使用するだけです。 .
よろしくお願いします
于 2016-03-05T11:41:19.930 に答える