0

私はボイラーパイプが初めてです。彼らのウェブサイトにあるサンプルコードを実行しようとしました:

  import java.net.URL;
  import de.l3s.boilerpipe.extractors.ArticleExtractor;
  import de.l3s.boilerpipe.extractors.DefaultExtractor;

    public class TESTURLBOILERPIPE {
        public static void main(String[] arges) throws Exception 

    {

         final URL url = new URL(
                    "http://www.l3s.de/web/page11g.do?sp=page11g&link=ln104g&stu1g.LanguageISOCtxParam=en");
         ArticleExtractor ae = new ArticleExtractor();
            System.out.println(ae.INSTANCE.getText(url));
    }
}

必要なすべての jar ファイルをクラス パスに追加しましたが、例外が発生します。

Exception in thread "main" java.lang.IllegalArgumentException: usage: supply url to fetch
at org.jsoup.helper.Validate.isTrue(Validate.java:45)
at org.jsoup.examples.HtmlToPlainText.main(HtmlToPlainText.java:26)
4

2 に答える 2

0

Boilerpipe についてはわかりませんが、正しい Java クラスを実行しようとしていますか? スタック トレースは、実行しようとしているように見えます(引数なし、したがって例外) が、投稿したコードから、クラスHtmlToPlainTextを実行したいと思います。TESTURLBOILERPIPE

于 2012-09-23T23:10:20.973 に答える
0

Python ラッパーを使用してみてください。手動でjpypeをインストールする必要があるかもしれませんが、すべての依存関係を処理します(ソースコードはsourceforgeにあります)。

https://github.com/misja/python-boilerpipe

于 2012-11-07T16:59:39.270 に答える