HTML ドキュメントの本文にある太字のスニペットをすべて抽出する必要があります。Javaを使用してサーバー側で行う必要があります(ブラウザではありません)
ページ上のテキストは、 、 などのタグ、インライン CSS スタイル、または CSS クラスを使用した外部 CSS スタイルが原因で太字になることが<b>
あり<h1>
ますstyle="font-weight:bold;"
。
私は Jsoup を使用していますが、これを行うために他のライブラリを使用することもできます。
御時間ありがとうございます!