0

次のWebページから2つの部分、記事の本文、および記事の画像からのsrcを抽出しようとしています

Javaでこれら2つの部分を抽出する方法を教えてもらえますか

http://www.ncataggies.com//ViewArticle.dbml?DB_OEM_ID=24500&ATCLID=205417767

4

1 に答える 1

0

ジャバまたはジャバスクリプト?

これを行う場合、ページを作成するときに URL のソースを開いて、class="article-body" 内からテキストを取得し、class="photocopy" 内で src=" をスクレイピングします。 "。これにより、すべてのテキストと画像のソースが得られます。

したがって、ページをロードし、基本的な文字列操作を使用して適切なクラスを見つけ、コンテンツを抽出するだけです。

これは役に立ちますか?特定のコードについてサポートが必要な場合は、まず試してみて、あなたが持っているものを投稿してください。そこからお手伝いできます。

于 2012-04-23T00:16:06.967 に答える