Javaコードを使用してWebから情報を抽出して処理しています.jsoup
ライブラリを使用して、Webサイトから取得した応答のhtmlタグを消去しています. これらのコードから情報を抽出するには、html タグを「~」などのめったに使用されない文字に置き換える必要があります。
だからここに私の質問があります:
これを変換するにはどうすればよいですか:
<h1>This is heading 1</h1>
<h2>This is heading 2</h2>
<h3>This is heading 3</h3>
<h4>This is heading 4</h4>
<h5>This is heading 5</h5>
<h6>This is heading 6</h6>
これに:
~This is heading 1~
~This is heading 2~
~This is heading 3~
~This is heading 4~
~This is heading 5~
~This is heading 6~
を使用してjsoup
いますか?