0

Webページからメインのニュースコンテンツを抽出する必要があります。インターネットで検索したところ、その目的で無料で利用できるBoilerpipeという名前のAPIが見つかりました。http://boilerpipe-web.appspot.com/しかし、で実装を見つけることができません。 Boilerpipeを利用するJava。JavaでBoilerpipeを使用してニュースコンテンツを抽出する方法や、Boilerpipeを使用してニュースWebページからコンテンツを抽出するJavaの実装へのリンクを教えてもらえますか?

4

2 に答える 2

1

私の答えは遅すぎるかもしれません。しかし、それはかなり単純です。

 URL url = new URL("http://www.nydailynews.com/sports/baseball"); 
 ArticleExtractor ae = new ArticleExtractor();
 String content = ae.getText(url);  // this contains the final text
于 2012-06-22T13:27:32.130 に答える
0

簡単ですね。このURLを抽出する必要があるとします。

私の BoilerPipe 代替 Web API HEREを使用してください。私のサービスはボイラーパイプに基づいています。元のアプリケーションで割り当て超過エラーが発生したため、これを開発しました。JSON で結果を取得するオプションがあり、アプリケーションでそれを使用するだけです。 .

よろしくお願いします

于 2016-03-05T11:41:19.930 に答える