java - ボイラープレートを使用して HTML から記事のメインコンテンツを取得する方法は?

翻译自：https://stackoverflow.com/questions/39952702 2016-10-10T06:53:30.900

135 次

ボイラーパイプコードを使用して HTML から記事のメインコンテンツを取得しようとしています。

hereから最新のjarをダウンロードしました。

次のコードを使用しようとしています。

String article = "";
try {
    article = ArticleExtractor.INSTANCE.getText(url);   
    System.out.println("Article ++++ >>" + article);    
} catch (BoilerpipeProcessingException e) {
    // TODO Auto-generated catch block
    e.printStackTrace();
}

しかし、これはすべての URL に対して空の文字列を返します。誰でもこれについて私を助けることができますか?

java - ボイラープレートを使用して HTML から記事のメイン コンテンツを取得する方法は?

1 に答える 1

Related

Reference

java - ボイラープレートを使用して HTML から記事のメインコンテンツを取得する方法は?