ページからリンクをスクレイピングし、playwright python を使用してディレクトリにダウンロードする簡単なプログラムを作成していました。メソッドを見つけましたlocator.get_attribute(name="href")
。必要なのは、検索するロケーターのリストだけでした。page.locator('a:has-text("LUA")')
メソッドを使用しましたが、うまくいきました。ただし、css セレクターを使用してすべてのロケーターを取得したわけではありません。セレンでは、メソッドを使用して要素のリストを簡単find_elements_by_class
に取得できましたが、劇作家のリストを見つけることができませんでした。クエリ セレクター メソッドを使用してみましたが、それは反復できなかった ElementHandle を返します。
私のコードは次のとおりです。
...
LOADSTRING = False if args.loadstring else True
TEXTFILE = False if args.textfile else True
with sync_playwright() as p:
browser = p.chromium.launch()
page = browser.new_page()
page.goto("https://funforcheap.cf/")
if LOADSTRING:
LINKLIST = []
elem = page.locator('a:has-text("LUA")')
print(elem)
for url in elem: # Not Working
link = url.get_attribute(name="href")
LINKLIST.append(link)
print(LINKLIST)