indexing - urllib2: 複数のキーワードのインデックス作成

Question

私はしばらくの間見回してきましたが、urllib2 の index コマンドの使用に関するガイドが見つからないようです。基本的に、この関数は、インデックス関数が指定した文字を含む/または含む最初の単語を見つけ、その位置を返します。

page_content= urllib2.urlopen(URL).read() #Gets the website
i1 = page_content.index(keyword) #finds keyword in the website

そして、ここから i1 は urllib2 のさまざまなことに使用できますが、それはこれとは関係ありません。

私の問題は、 .index がキーワードに一致するすべての単語を取得するのではなく、最初の単語のみを取得することです。Web サイトにこの種のものが 1 つしかないことがわかっている場合は問題ありませんが、それらすべてをリストに割り当てて、そこから位置を取得して使用できるようにしたいと考えています。

score 0 · Accepted Answer

ユーザー再機能

import re 
page_content= urllib2.urlopen(URL).read() #Gets the website
idall = [m.start() for m in re.finditer(keyword,page_content)]

print idall

indexing - urllib2: 複数のキーワードのインデックス作成

1 に答える 1

Related

Reference