これには簡単な答えがあると確信していますが、私は完全に立ち往生しています!
さまざまな数の単語のリストのリストがあり、テキスト ファイルでこれらの単語を見つけることができるかどうかを確認しようとしています。したがって、検索したい単語のリストが次の場合:
stem=[[u'travail',u'electr'],[u'la',u'vou']]
次に、語幹リストの各「行」の各単語をループして、テキスト ファイルでその単語を見つけようとしています。このコードは、一致した単語の位置のインデックスを返します。
for row in stem:
for j,i in enumerate(row):
y=[match.start() for match in re.finditer(re.escape(i), lowe)]
print y
出力:
[669, 2102, 5810]
[1452, 2120, 5628]
[1582, 2912, 3109, 5711]
[605, 761, 882, 948, 1126, 1132, 1357, 1646, 1936, 2011, 2765, 3286, 3316, 3512, 3821, 3839, 3879, 4012, 4052, 4159, 4417, 4457, 4492, 4699, 4813, 4850, 4921, 4966, 4991, 4998, 5008, 5046, 5118, 5201, 5359, 5506, 5680]
次のような出力を取得するにはどうすればよいですか
[[[669, 2102, 5810], [1452, 2120, 5628]], [[1582, 2912, 3109, 5711], [605, 761, 882, 948, 1126, 1132, 1357, 1646, 1936, 2011, 2765, 3286, 3316, 3512, 3821, 3839, 3879, 4012, 4052, 4159, 4417, 4457, 4492, 4699, 4813, 4850, 4921, 4966, 4991, 4998, 5008, 5046, 5118, 5201, 5359, 5506, 5680]]]
各行の出力が独自のリストにあるように?ありがとう!!