python - 元のソースリストに単語が見つからないのはなぜですか？

Question

2つの異なるファイルでchinesseの単語を検索しようとしていますが、機能しなかったため、取得した同じファイルで単語を検索しようとしましたが、どちらも見つからないようです。どうしてそれは可能ですか？

chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")

これを正規表現コードに使用しました。

import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
    print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())

どうして私はfalses印刷されるだけなのか？

参考までに私はこれをやろうとしました、そしてそれはうまくいきます：

for x in [1,2,3,4,5,6,6]:
    print x in [1,2,3,4,5,6,6]

ところで

chin_split英語ヘブライ語と中国語の単語が含まれています

からのいくつかの行chin_split.txt：

 he daodan   核导弹     טיל גרעיני     
 hedantou    核弹头     ראש חץ גרעיני      
 helu    阖庐  "ביתו, מעונו 
 helu    阖庐   שם מלך וו בתקופת ה'אביב והסתיו'"      
 huiwu   会晤  להיפגש עם

score 3 · Accepted Answer

ファイル記述子を何度も読んでいますが、それは間違っています。

最初のchin_split.read()ものはすべてのコンテンツを生成しますが、他のもの (ループ内) は空の文字列を取得します。

そのループは意味がありませんが、保持したい場合は、最初にファイルの内容を変数に保存してください。

python - 元のソースリストに単語が見つからないのはなぜですか？

1 に答える 1

Related

Reference