0

Web ページを呼び出すスクリプトを作成しようとしています (http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode=Tree&id=7742&lvl=3&lin=f&keep=1&srchmode=1&unlock )、それをスキャンし、ネストされた各分類グループ内の目、科、属、および種を引き出します。ただし、脊椎動物 (Web サイト全体の非常に小さなセクション) のみが必要ですが、さまざまな脊椎動物の分類群に関連付けられている URL は、識別可能なパターン (つまり、連続したもの) ではありません。これを合理的に行う方法はありますか?この目標を達成するためのさまざまな方法を策定しようとして、私は多くの問題を抱えてきました。

4

1 に答える 1

0

正確に何をしたいのか(少なくとも私には)明確ではありませんが、私が理解したこととして、ページ内のリンクを探し、サイトをナビゲートして分類するある種のクローラーを作成する必要があります?

もしそうなら、あなたがウェブブラウザをエミュレートすることを可能にする機械化に行き、そしてサイトに沿ってナビゲートし、リンクを簡単に抽出してたどり、フォームを提出するなど。

于 2011-07-29T00:42:25.463 に答える