-2

レポートを書いているのですが、テキストファイルのユニークな単語を数える必要があります。

私のテキストはD:\ shakeallにあり、全部で42ファイルです...

Pythonについては知っていますが、今何をすべきかわかりません。

これは私がそれがどのように機能するかを知っていることです。

  1. ディレクトリ内のファイルを読み取る

  2. テキストから単語のリストを作成します

  3. 合計/一意の単語を数える

私が知っているのはこれだけです。そして、for、while、リストとインデックス、変数、リストについてのいくつか...

私がやりたいのは、独自の関数ライブラリを作成し、それを使用して結果を取得することです。

私の質問についてのアドバイスに本当に感謝しています。

------ ps

私はPythonについてほとんど何も知りません。私にできることは、単純な数学かリストに単語を印刷することだけです。与えられたトピックは私には難しすぎます。ごめん。

4

2 に答える 2

3
textfile=open('somefile.txt','r')
text_list=[line.split(' ') for line in textfile]
unique_words=[word for word in text_list if word not in unique_words]
print(len(unique_words))

それがその一般的な要点です

于 2012-08-07T09:15:12.387 に答える
2
import os
uniquewords = set([])

for root, dirs, files in os.walk("D:\\shakeall"):
    for name in files:
        [uniquewords.add(x) for x in open(os.path.join(root,name)).read().split()]

print list(uniquewords)
print len(uniquewords)
于 2012-08-07T09:15:35.163 に答える