java - AndroidでWebサイトを解析/スクレイピングするライブラリ?

Question

次のWebページから2つの部分、記事の本文、および記事の画像からのsrcを抽出しようとしています

Javaでこれら2つの部分を抽出する方法を教えてもらえますか

score 0 · Accepted Answer

ジャバまたはジャバスクリプト？

これを行う場合、ページを作成するときに URL のソースを開いて、class="article-body" 内からテキストを取得し、class="photocopy" 内で src=" をスクレイピングします。 "。これにより、すべてのテキストと画像のソースが得られます。

したがって、ページをロードし、基本的な文字列操作を使用して適切なクラスを見つけ、コンテンツを抽出するだけです。

これは役に立ちますか？特定のコードについてサポートが必要な場合は、まず試してみて、あなたが持っているものを投稿してください。そこからお手伝いできます。

1 に答える 1