python - Python で Web サイトにログオンし、保存済みのデータ検索を読み込み、データをページごとにエクスポートする方法

Question

ウェブページ上のデータの保存済み検索をロードする python スクリプトを作成しようとしています (これは、ライブラリを介してアクセスされる Orbis データセットです)、データを Excel または CSV にエクスポートします。これには以下が含まれます。

リンク「結果のリストを表示」タブをクリックする必要があります (これは私が行うことができます)
一度に 25 社の結果が表示され、[Excel にエクスポート] ボタンをクリックして Excel にエクスポートできます。次に、結果のどのページのエントリを (1 から40,000)、各ページを 1 つずつエクスポートします。（これは私が部分的に行うことができます）

編集 2: 質問を絞り込むために、ログオン、検索の設定、エクスポートページへのアクセスを自動化できます。スプリンターを使用しています。ただし、エクスポートウィンドウはポップアップであり、splinter は (私の知る限りでは) ポップアップに移動して、エクスポートの条件を入力し、エクスポートをクリックすることはできません。

質問ポップアップウィンドウに移動する方法 (splinter またはその他の方法で) はありますか? これが私のコードです：

from splinter import Browser

browser = Browser('firefox')
browser.visit('https://weblogin.umich.edu/?cosign-www.lib&https://www.lib.umich.edu/cgi/l/login/proxy-session-init-qurl?qurl=https%3a%2f%2forbis2.bvdep.com%2fip')
browser.fill('login', 'username')
browser.fill('password', 'psswd')
browser.find_by_value('Log In').click()
browser.find_by_id('ContentContainer1_ctl00_Content_QuickSearch1_ctl02_TabSavedSearchesTd').click()

# Problem, here firefox doesn't save the searches
test_link= browser.find_link_by_text("My Search 1")
test_link.click()

#test entry into text field

# browser.fill('ContentContainer1$ctl00$Header$ctl00$ctl07$SearchText2008','xyz')

test_link= browser.find_link_by_text("Export")
test_link.click()

# Problem -- here the export comes out as a popup, then the scraper can't follow it
# browser.visit('newlink-popup')
# browser.fill('RANGEFROM', '1')  # Therefore can't use this command`

どんな助けでも大歓迎です。ありがとう。

python - Python で Web サイトにログオンし、保存済みのデータ検索を読み込み、データをページごとにエクスポートする方法

0 に答える 0

Related

Reference