1

一致するリストは 2 つありますli_a。与えられたリストは文の一連の文字で構成されていますli_bが、 は単語のコレクションです。

li_a = ['T','h','e','s','e','45','a','r','e','c','a','r','s']


li_b = ['T','Th','The','Thes','These','a','ar','are','c','ca','car','cars']

li_aプロセスは、アイテムとアイテムを繰り返し一致させることですli_b。の最初の文字がアイテムにli_a類似している場合、 の最初の文字は次の文字と結合し、最長一致になるまでプロセスをやり直します。次に、最長期間を分割する必要があり、プロセスは最後まで続きます。に出てこない未知の文字や言葉はそのまま追記します。li_bli_ali_ali_b

最終的な作業は次のようになります。

new_li = ['These','45','are','cars']

ここまでの試みですが、これはListsではなく2 つの文字列に対して機能し、未確認の単語を取得しません。

def longest_matched_substring(s1, s2):
    m = [[0] * (1 + len(s2)) for i in xrange(1 + len(s1))]
    longest, x_longest = 0, 0
    for x in xrange(1, 1 + len(s1)):
       for y in xrange(1, 1 + len(s2)):
           if s1[x - 1] == s2[y - 1]:
               m[x][y] = m[x - 1][y - 1] + 1
               if m[x][y] > longest:
                   longest = m[x][y]
                   x_longest = x
           else:
               m[x][y] = 0

    return s1[x_longest - longest: x_longest]
4

1 に答える 1