Web ページのトップ メニューと Web ページのコンテンツ領域を XML ドキュメントに抽出する必要があります。これを実行できるツールはありますか? この出力は、サイトマップとページのメイン コンテンツ領域内の各ページのコンテンツである、Web サイトのトップ メニュー構造である必要があります。
または、既存のツールを提案できない場合は、この問題を解決する方法を提案していただけますか?
Web ページのトップ メニューと Web ページのコンテンツ領域を XML ドキュメントに抽出する必要があります。これを実行できるツールはありますか? この出力は、サイトマップとページのメイン コンテンツ領域内の各ページのコンテンツである、Web サイトのトップ メニュー構造である必要があります。
または、既存のツールを提案できない場合は、この問題を解決する方法を提案していただけますか?
Automatic Web Data Extraction APIを使用すると、スクリプトを記述せずに URL からデータを自動的に抽出できます。