Goose ライブラリを使用して Web ページからコンテンツを抽出する小さな Android アプリケーションをセットアップしようとしています。ライブラリは Scala で記述されているため、ここで見つけた .jar を使用しています。問題は、ページからコンテンツを抽出しようとすると、何も返されないことです。必要な URL を使用してオブジェクトを正常に作成しましたArticle
が、オブジェクトの値 (タイトル、ドメイン、topImage など) はすべてnull
. 問題が単一の Web サイトに限定されているかどうかを確認するために、別の URL を使用してみましたが、そうではないようです。
Goose
インスタンスのセットアップに使用するコードは次のとおりです。
gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);
そして、次のArticle
ようにインスタンスを作成します。
Article article = goose.extractContent(url);
何かアドバイス?