1

Python (xbmc/kodi) を使用して Javascript カレンダー ページのセクションをスクレイピングしようとしています。これまでのところ、静的な html 変数はスクレイピングできましたが、JavaScript で生成されたセクションはスクレイピングできませんでした。

取得しようとしている変数は<strong class="item-title">**this**</strong> , <span class="item-daterange">**this**</span> and <div class="item-location">**this**</div>です。それらは html ソースの別々のセクションにあり、JavaScript によってレンダリングされることに注意してください。スクレイピングされた変数はすべて、1 つの文字列に追加して表示する必要があります。

response = net.http_GET('my URL')
    link = response.content
    match=re.compile('<strong class="gcf-item-title">(.+?)</strong>').findall(link)
    for name in match:
        name = name
        print name

上記の正規表現から、これらの変数の1つだけをスクレイピングできます。すべての変数をまとめて表示するには文字列リストが必要なので、どうすればよいですか?

javascript変数をスクレイピングするには、ページを事前にレンダリングする必要があることがわかりましたが、 xbmc を使用しているため、dryscrapeなどの追加のpythonライブラリをインポートしてこれを行う方法がわかりません。Dryscrape をダウンロードすると、 setup.py 、init .py ファイルと他のいくつかのファイルが提供されますが、それらすべてを一緒に使用するにはどうすればよいですか?

ありがとう。

4

1 に答える 1