私は Java htmlcleaner を使用しており、最初の body タグとそのすべての子のみをスクレイピングしようとしています。html、head、doctype タグは省略したいと思います。
nodeByXpath を見ましたが、Java ではなく ant でのみ機能するようです。Javaでこれを行う方法を知っている人はいますか?
私は Java htmlcleaner を使用しており、最初の body タグとそのすべての子のみをスクレイピングしようとしています。html、head、doctype タグは省略したいと思います。
nodeByXpath を見ましたが、Java ではなく ant でのみ機能するようです。Javaでこれを行う方法を知っている人はいますか?