ウェブページ上のデータの保存済み検索をロードする python スクリプトを作成しようとしています (これは、ライブラリを介してアクセスされる Orbis データセットです)、データを Excel または CSV にエクスポートします。これには以下が含まれます。
リンク 「結果のリストを表示」タブをクリックする必要があります (これは私が行うことができます)
一度に 25 社の結果が表示され、[Excel にエクスポート] ボタンをクリックして Excel にエクスポートできます。次に、結果のどのページのエントリを (1 から40,000)、各ページを 1 つずつエクスポートします。(これは私が部分的に行うことができます)
編集 2: 質問を絞り込むために、ログオン、検索の設定、エクスポート ページへのアクセスを自動化できます。スプリンターを使用しています。ただし、エクスポート ウィンドウはポップアップであり、splinter は (私の知る限りでは) ポップアップに移動して、エクスポートの条件を入力し、エクスポートをクリックすることはできません。
質問 ポップアップ ウィンドウに移動する方法 (splinter またはその他の方法で) はありますか? これが私のコードです:
from splinter import Browser
browser = Browser('firefox')
browser.visit('https://weblogin.umich.edu/?cosign-www.lib&https://www.lib.umich.edu/cgi/l/login/proxy-session-init-qurl?qurl=https%3a%2f%2forbis2.bvdep.com%2fip')
browser.fill('login', 'username')
browser.fill('password', 'psswd')
browser.find_by_value('Log In').click()
browser.find_by_id('ContentContainer1_ctl00_Content_QuickSearch1_ctl02_TabSavedSearchesTd').click()
# Problem, here firefox doesn't save the searches
test_link= browser.find_link_by_text("My Search 1")
test_link.click()
#test entry into text field
# browser.fill('ContentContainer1$ctl00$Header$ctl00$ctl07$SearchText2008','xyz')
test_link= browser.find_link_by_text("Export")
test_link.click()
# Problem -- here the export comes out as a popup, then the scraper can't follow it
# browser.visit('newlink-popup')
# browser.fill('RANGEFROM', '1') # Therefore can't use this command`
どんな助けでも大歓迎です。ありがとう。