同じトピックに関する一連の URL を抽出しました。Pythonを使用してグラフを形成できるように、それらの間のリンクを見つけたいです。URL または Web サイトはノードとして表され、それらの間のリンクはエッジとして表されます。私を助けてください..
質問する
243 次
1 に答える
0
この簡単なアプローチに従うことができます-
[1]を使用して Web ページを解析BeautifulSoup
し、アンカー タグのhref
プロパティをネストされたリスト (lst を想定) に保存します。したがって、Web ページ (web1 を想定) が他の 3 つの Web ページ (リンクは href1、href2、href3 を想定) にリンクしている場合、-
lst['web1'][0] = 'href1'
lst['web1'][1] = 'href2'
lst['web1'][2] = 'href3'
同様に、他の Web ページを解析し、それらのリストを作成します。この web1 は、webx の hrefx にすることができます。あなたがアイデアを得たことを願っています。
于 2012-12-31T10:26:57.657 に答える