1

2つの異なるファイルでchinesseの単語を検索しようとしていますが、機能しなかったため、取得した同じファイルで単語を検索しようとしましたが、どちらも見つからないようです。どうしてそれは可能ですか?

chin_split = codecs.open("CHIN_split.txt","r+",encoding="utf-8")

これを正規表現コードに使用しました。

import re
for n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read()):
    print n in re.findall(ur'[\u4e00-\u9fff]+',chin_split.read())    

どうして私はfalses印刷されるだけなのか?

参考までに私はこれをやろうとしました、そしてそれはうまくいきます:

for x in [1,2,3,4,5,6,6]:
    print x in [1,2,3,4,5,6,6]

ところで

chin_split英語ヘブライ語と中国語の単語が含まれています

からのいくつかの行chin_split.txt

 he daodan   核导弹     טיל גרעיני     
 hedantou    核弹头     ראש חץ גרעיני      
 helu    阖庐  "ביתו, מעונו 
 helu    阖庐   שם מלך וו בתקופת ה'אביב והסתיו'"      
 huiwu   会晤  להיפגש עם      
4

1 に答える 1

3

ファイル記述子を何度も読んでいますが、それは間違っています。

最初のchin_split.read()ものはすべてのコンテンツを生成しますが、他のもの (ループ内) は空の文字列を取得します。

そのループは意味がありませんが、保持したい場合は、最初にファイルの内容を変数に保存してください。

于 2012-08-25T11:58:57.083 に答える