ボイラーパイプコードを使用して HTML から記事のメイン コンテンツを取得しようとしています。
hereから最新のjarをダウンロードしました。
次のコードを使用しようとしています。
String article = "";
try {
article = ArticleExtractor.INSTANCE.getText(url);
System.out.println("Article ++++ >>" + article);
} catch (BoilerpipeProcessingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
しかし、これはすべての URL に対して空の文字列を返します。誰でもこれについて私を助けることができますか?