次のWebページから2つの部分、記事の本文、および記事の画像からのsrcを抽出しようとしています
Javaでこれら2つの部分を抽出する方法を教えてもらえますか
http://www.ncataggies.com//ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205417767
次のWebページから2つの部分、記事の本文、および記事の画像からのsrcを抽出しようとしています
Javaでこれら2つの部分を抽出する方法を教えてもらえますか
http://www.ncataggies.com//ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205417767
ジャバまたはジャバスクリプト?
これを行う場合、ページを作成するときに URL のソースを開いて、class="article-body" 内からテキストを取得し、class="photocopy" 内で src=" をスクレイピングします。 "。これにより、すべてのテキストと画像のソースが得られます。
したがって、ページをロードし、基本的な文字列操作を使用して適切なクラスを見つけ、コンテンツを抽出するだけです。
これは役に立ちますか?特定のコードについてサポートが必要な場合は、まず試してみて、あなたが持っているものを投稿してください。そこからお手伝いできます。