私はHTMLUnitを使い始めたばかりで、私が探しているのはWebページを取得し、そこからすべてのhtmlマークアップを除いた生のテキストを抽出することです。
htmlunitはそれを達成できますか?もしそうなら、どのように?それとも、私が見なければならない別のライブラリがありますか?
たとえば、ページにが含まれている場合
<body><p>para1 test info</p><div><p>more stuff here</p></div>
出力したい
para1 test info more stuff here
ありがとう