4

HTML ページの記事要約を作成しようとしています。これまでのところ、ボイラーパイプと classifier4J を使用ました。

//url can be any url in String
public String getArticleSummaryFromUrl() {
    private Document doc = Jsoup.connect(url).get();;
    String summary = "";
    String article = "";    
    try {
        article = ArticleExtractor.INSTANCE.getText(doc.html());    
        System.out.println("Article ++++ >>" + article);
        SimpleSummariser ss = new SimpleSummariser();       
        summary = ss.summarise(article, 4);
        } catch (BoilerpipeProcessingException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }       
        return summary;
}

しかし、ほとんどの場合、文の構成が適切に行われていないため、コードは目的の結果を生成しません。

http://smmry.com/のようなきちんとしたものを実装しようとしています。

これを行うJavaライブラリを知っている人はいますか?

4

0 に答える 0