-1

python playwright から外側の html を返すメソッドが見つかりませんでし page.locator(selector, **kwargs)た。何か不足していますか? locator.inner_html(**kwargs)存在します。ただし、pandas.read_html を使用しようとしていますが、テーブル タグをトリップするため、テーブル ロケーターの内部 html で失敗します。

私が現在行っているのは、bs4 を使用して page.content() を解析することです。何かのようなもの:

soup = BeautifulSoup(page.content(), 'lxml')
df = pd.read_html(str(soup.select('table.selector')))
4

1 に答える 1