2つの異なるファイルでchinesseの単語を検索しようとしていますが、機能しなかったため、取得した同じファイルで単語を検索しようとしましたが、どちらも見つからないようです。どうしてそれは可能ですか?
chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")
これを正規表現コードに使用しました。
import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())
どうして私はfalses
印刷されるだけなのか?
参考までに私はこれをやろうとしました、そしてそれはうまくいきます:
for x in [1,2,3,4,5,6,6]:
print x in [1,2,3,4,5,6,6]
ところで
chin_split
英語ヘブライ語と中国語の単語が含まれています
からのいくつかの行chin_split.txt
:
he daodan 核导弹 טיל גרעיני
hedantou 核弹头 ראש חץ גרעיני
helu 阖庐 "ביתו, מעונו
helu 阖庐 שם מלך וו בתקופת ה'אביב והסתיו'"
huiwu 会晤 להיפגש עם