だから私はロミオとジュリエットの演劇からの第1幕のスクリプトを含むテキストファイルを持っています、そして私は誰かが単語を言った回数を数えたいです。
ここにテキストがあります:http://pastebin.com/X0gaxAPK
テキストで話しているのは、グレゴリー、サンプソン、アブラハムの3人です。
基本的に、3人の話者のそれぞれに3つの異なる辞書を作成したいと思います(それが最善の方法である場合)。辞書に人々がそれぞれ言う単語を入力し、スクリプト全体で各単語を何回言ったかを数えます。
どうすればこれを行うことができますか?単語数はわかると思いますが、誰が何を言っているのかを分けて、一人一人の3つの辞書に入れる方法が少しわかりません。
私の出力は次のようになります(これは正しくありませんが、例です):
Gregory -
25: the
15: a
5: from
3: while
1: hello
etc
ここで、数字はファイルで述べられている単語の頻度です。
現在、テキストファイルを読み取り、句読点を取り除き、テキストをリストにコンパイルするコードを記述しています。また、外部モジュールは使用したくありません。昔ながらの学習方法を使用したいと思います。ありがとうございます。
正確なコードを投稿する必要はありません。私が何をする必要があるかを説明するだけで、うまくいけばそれを理解できます。私はPython3を使用しています。