0

同じトピックに関する一連の URL を抽出しました。Pythonを使用してグラフを形成できるように、それらの間のリンクを見つけたいです。URL または Web サイトはノードとして表され、それらの間のリンクはエッジとして表されます。私を助けてください..

4

1 に答える 1

0

この簡単なアプローチに従うことができます-

[1]を使用して Web ページを解析BeautifulSoupし、アンカー タグのhrefプロパティをネストされたリスト (lst を想定) に保存します。したがって、Web ページ (web1 を想定) が他の 3 つの Web ページ (リンクは href1、href2、href3 を想定) にリンクしている場合、-

lst['web1'][0] = 'href1'
lst['web1'][1] = 'href2'
lst['web1'][2] = 'href3'

同様に、他の Web ページを解析し、それらのリストを作成します。この web1 は、webx の hrefx にすることができます。あなたがアイデアを得たことを願っています。

[1] http://www.crummy.com/software/BeautifulSoup/

于 2012-12-31T10:26:57.657 に答える