改行に関係なく 2 つの文書を比較したい。内容は同じでも改行の位置や量が違う場合、一方の文書の行を他方の文書の行にマッピングしたい。
与えられた:
資料1
I went to Paris in July 15, where I met some nice people.
And I came back
to NY in Aug 15.
I am planning
to go there soon
after I finish what I do.
資料2
I went
to Paris
in July 15,
where I met
some nice people.
And I came back to NY in Aug 15.
I am planning to go
there soon after I finish what I do.
ドキュメント 1 の 1 行目にドキュメント 2 の 1 行目から 5 行目までと同じテキストが含まれていること、ドキュメント 1 の 2 行目と 3 行目にドキュメント 2 の 6 行目と同じテキストが含まれていることなどを判断できるアルゴリズムが必要です。
1 = 1,2,3,4,5
2,3 = 6
4,5,6 = 7,8
正規表現が他のドキュメントの複数の行にまたがる場合、各ドキュメントの各行を一致させる方法はありますか?