1

Goose ライブラリを使用して Web ページからコンテンツを抽出する小さな Android アプリケーションをセットアップしようとしています。ライブラリは Scala で記述されているため、ここで見つけた .jar を使用しています。問題は、ページからコンテンツを抽出しようとすると、何も返されないことです。必要な URL を使用してオブジェクトを正常に作成しましたArticleが、オブジェクトの値 (タイトル、ドメイン、topImage など) はすべてnull. 問題が単一の Web サイトに限定されているかどうかを確認するために、別の URL を使用してみましたが、そうではないようです。

Gooseインスタンスのセットアップに使用するコードは次のとおりです。

gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);

そして、次のArticleようにインスタンスを作成します。

Article article = goose.extractContent(url);

何かアドバイス?

4

1 に答える 1

1

実際には、互換性がないため、Android で Goose ライブラリを使用することはできませんが、私の Android バージョンを使用することはできます: https://github.com/milosmns/goose

Goose とほぼ同じことを行いますが、Android でのみうまく機能します。

于 2016-09-05T09:22:30.627 に答える