0

データをインポートするcsvファイルがあります。2 つのエッセイで使用されている単語と、それらが使用されている回数のリストを作成しようとしています。ループを実行して、2 つのエッセイを含む csv ファイルの各行を取得しています。出力には、2 つのエッセイ間の合計単語数が表示されます。ただし、それぞれ 2 つのエッセイがある何百もの行があります。すべてのエッセイのすべての単語と単語数を含む 1 つのリストが必要です。

import textmining

import csv

with open('2011ShortAnswers.csv', 'rb') as csvfile:
    data = csv.reader(csvfile, delimiter=",")

    for row in data:
        doc1 = row[3]
        doc2 = row[4]

        tdm = textmining.TermDocumentMatrix()

        tdm.add_doc(doc1)
        tdm.add_doc(doc2)

        for row in tdm.rows(cutoff=1):
            print row
4

1 に答える 1