python - Pythonで特定のディレクトリ内のテキストファイルの一意の単語をカウントするにはどうすればよいですか？

Question

レポートを書いているのですが、テキストファイルのユニークな単語を数える必要があります。

私のテキストはD：\ shakeallにあり、全部で42ファイルです...

Pythonについては知っていますが、今何をすべきかわかりません。

これは私がそれがどのように機能するかを知っていることです。

ディレクトリ内のファイルを読み取る
テキストから単語のリストを作成します
合計/一意の単語を数える

私が知っているのはこれだけです。そして、for、while、リストとインデックス、変数、リストについてのいくつか...

私がやりたいのは、独自の関数ライブラリを作成し、それを使用して結果を取得することです。

私の質問についてのアドバイスに本当に感謝しています。

------ ps

私はPythonについてほとんど何も知りません。私にできることは、単純な数学かリストに単語を印刷することだけです。与えられたトピックは私には難しすぎます。ごめん。

score 3 · Accepted Answer

textfile=open('somefile.txt','r')
text_list=[line.split(' ') for line in textfile]
unique_words=[word for word in text_list if word not in unique_words]
print(len(unique_words))

それがその一般的な要点です

score 2 · Accepted Answer

import os
uniquewords = set([])

for root, dirs, files in os.walk("D:\\shakeall"):
    for name in files:
        [uniquewords.add(x) for x in open(os.path.join(root,name)).read().split()]

print list(uniquewords)
print len(uniquewords)

python - Pythonで特定のディレクトリ内のテキストファイルの一意の単語をカウントするにはどうすればよいですか？

2 に答える 2

Related

Reference