3

HTML ドキュメントの本文にある太字のスニペットをすべて抽出する必要があります。Javaを使用してサーバー側で行う必要があります(ブラウザではありません)

ページ上のテキストは、 、 などのタグ、インライン CSS スタイル、または CSS クラスを使用した外部 CSS スタイルが原因で太字になることが<b>あり<h1>ますstyle="font-weight:bold;"

私は Jsoup を使用していますが、これを行うために他のライブラリを使用することもできます。

御時間ありがとうございます!

4

4 に答える 4

1

getElementsByTagName()を使用できます

http://www.w3schools.com/jsref/met_doc_getelementsbytagname.asp

また、役立つ場合があります

https://developer.mozilla.org/en-US/docs/DOM/Document.querySelectorAll

幸運を祈ります、ダニエル

于 2013-05-13T10:01:23.970 に答える
1

タグとインライン スタイル (たとえば、html に直接追加されたスタイル、外部の CSS スタイルシートに含まれていないスタイル) については、css セレクターリンクを使用できます。(インライン スタイルの場合は[style*="font-weight:bold;"])。

于 2013-05-13T10:02:29.223 に答える