私は、さまざまな形式のサイトから同様のデータ (タイトルと日付) を取得するユーティリティを構築していますが、BeautifulSoup は非常に役に立ちました。サイトごとに新しい関数を作成する必要がないように、使用している BeautifulSoup 関数を保存する良い方法がわかりません。次に例を示します。
soup = BeautifulSoup(html)
title = soup.find("h4", "title").text # extract title
date = soup.find('li', 'when').em.text # extract date
各サイトには、解析するノードの異なるセットがあります。何百ものサイトがあるので、それぞれに独自の機能を構築するのはばかげています。soup.find('x').etc.etc 呼び出しを URL と一緒にテーブルに格納し、1 つの関数内で正しい BeautifulSoup 呼び出しを適用する方法はありますか? これが理にかなっていることを願っています。
ありがとう!