一致するリストは 2 つありますli_a
。与えられたリストは文の一連の文字で構成されていますli_b
が、 は単語のコレクションです。
li_a = ['T','h','e','s','e','45','a','r','e','c','a','r','s']
li_b = ['T','Th','The','Thes','These','a','ar','are','c','ca','car','cars']
li_a
プロセスは、アイテムとアイテムを繰り返し一致させることですli_b
。の最初の文字がアイテムにli_a
類似している場合、 の最初の文字は次の文字と結合し、最長一致になるまでプロセスをやり直します。次に、最長期間を分割する必要があり、プロセスは最後まで続きます。に出てこない未知の文字や言葉はそのまま追記します。li_b
li_a
li_a
li_b
最終的な作業は次のようになります。
new_li = ['These','45','are','cars']
ここまでの試みですが、これはListsではなく2 つの文字列に対して機能し、未確認の単語を取得しません。
def longest_matched_substring(s1, s2):
m = [[0] * (1 + len(s2)) for i in xrange(1 + len(s1))]
longest, x_longest = 0, 0
for x in xrange(1, 1 + len(s1)):
for y in xrange(1, 1 + len(s2)):
if s1[x - 1] == s2[y - 1]:
m[x][y] = m[x - 1][y - 1] + 1
if m[x][y] > longest:
longest = m[x][y]
x_longest = x
else:
m[x][y] = 0
return s1[x_longest - longest: x_longest]