私は HTML の解析に JTidy と xpath を使用していますが、テキストの解析には b タグが含まれている可能性があるため、しばらくの間、少し問題が発生します。そのため、子ノードをループしたくなく、単に 'b' タグを後で削除します。 html をロードします。
DOM ドキュメントからタグを削除するにはどうすればよいですか。
Document doc = tidy.parseDOM(url.openStream(), System.out);
たとえば、そのための擬似コード-doc.removeTag('<b>');
出来ますか ?