私は私の大学の教授の 1 人のオフィスで働いており、盗作をしている人々を捕まえるためにクラス全体の論文を読むように彼から割り当てられたので、Python を使用して 6 つの語句すべてを調べるプログラムを作成することにしました。 200 を超えるフレーズが一致する論文があるかどうかを比較します。6 つの語句は、たとえば次のようになります。
ポテトを食べましたが、おいしかったです。だろう:
私はポテトを食べました
じゃがいもを食べた
じゃがいもでよかったです。
私のコードは正しく
import re
def ReadFile(Filename):
try:
F = open(Filename)
F2=F.read()
except IOError:
print("Can't open file:",Filename)
return []
F3=re.sub("[^a-z ]","",F2.lower())
return F3
def listEm(BigString):
list1=[]
list1.extend(BigString.split(' '))
return list1
Name = input ('Name of file? ')
Words = ReadFile(Name)
Words2= listEm(Words)
index1=0
index2=6
new_list=[]
while index2 <= len(Words2):
new_list.append(Words2[index1:index2])
index1 += 1
index2 +=1
print (new_list)
フォルダー内の 1 つのファイルに対して 6 つの語句すべてを作成することはできますが、フォルダー内のすべてのファイルに対して作成する方法と、それらを比較する方法について混乱しています。第一学期のコンプ科学専攻からのすべての助けに感謝します。