私はひもを持っています、
data = 'very <strong class="keyword">Awesome</strong> <strong class="keyword">Book</strong> discount'
リストの出力を次のように取得したい
ans = ['very','<strong class="keyword">Awesome</strong>','<strong class="keyword">Book</strong>','discount']
だから私は単語の位置を知ることができ、また単語はタグで発生しました。私はBeautifulSoupを使用して単語を抽出しましたが、withという単語はありません。しかし、私は位置を見つける必要があります。私が試したコード。
from bs4 import BeautifulSoup as BS
data = 'very <strong class="keyword">Awesome</strong> <strong class="keyword">Book</strong>'
soup = BS(data)
to_extract = soup.findAll('strong')
[comment.extract() for comment in to_extract]
soup = str(soup)
notInStrongWords = []
for t in to_extract:
t_soup = BS('{0}'.format(t))
t_tag = t_soup.strong
matchWords.append(t_tag.string)
soup = re.sub("[^A-Za-z0-9\\-\\.\\(\\)\\\\\/\\&': ]+",' ', soup)
soup = re.findall('[(][^)]*[)]|\S+', soup)
InStrongWords = []
InStrongWords = [x for x in soup]
前もって感謝します。