python - 複数の URL を呼び出してそれらからデータを取得する Python

Question

Web ページを呼び出すスクリプトを作成しようとしています (http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode=Tree&id=7742&lvl=3&lin=f&keep=1&srchmode=1&unlock )、それをスキャンし、ネストされた各分類グループ内の目、科、属、および種を引き出します。ただし、脊椎動物 (Web サイト全体の非常に小さなセクション) のみが必要ですが、さまざまな脊椎動物の分類群に関連付けられている URL は、識別可能なパターン (つまり、連続したもの) ではありません。これを合理的に行う方法はありますか？この目標を達成するためのさまざまな方法を策定しようとして、私は多くの問題を抱えてきました。

score 0 · Accepted Answer

正確に何をしたいのか（少なくとも私には）明確ではありませんが、私が理解したこととして、ページ内のリンクを探し、サイトをナビゲートして分類するある種のクローラーを作成する必要があります？

もしそうなら、あなたがウェブブラウザをエミュレートすることを可能にする機械化に行き、そしてサイトに沿ってナビゲートし、リンクを簡単に抽出してたどり、フォームを提出するなど。

python - 複数の URL を呼び出してそれらからデータを取得する Python

1 に答える 1

Related

Reference