1

portia (scrapy) を使用して Web サイトからメタタグを抽出する

一部の Web サイトからメタ タグを抽出するために portia を使用したいのですが、head タグが表示されず、body タグのみから開始されています。

body タグからしかデータを抽出できません

4

2 に答える 2

1

これをメタ名に使用できます。

meta_name = hxs.select('//meta/@name').extract()

これはメタコンテンツ用です:

meta_content = hxs.select('//meta/@content').extract()

これは、説明のような特定の名前を持つメタのコンテンツの場合です。

meta = hxs.select('//meta[@name=\'description\']/@content').extract()
于 2015-08-01T10:48:08.977 に答える