-5

さまざまな Web サイトからレビューを抽出してファイルに保存し、senti-wordnet (特定のスコアを与える) を使用して各文を肯定的または否定的に分類しています。Python 2.7 を使用しています。ファイルに保存されたレビューに対してどのように機能するかわかりません。このためのpythonのコードを知っている人はいますか?

f1=open("foodP.txt","r")
word_features =[]
words = []

for line in f1:
    word_features.append(line)
    s=str(word_features)
    tokens=nltk.word_tokenize(s)    

for i,j in nltk.pos_tag(tokens):
    if j in ['VBN','VBP','VB','JJ', 'JJR', 'JJS', 'RB', 'RBR', 'RBS']:
        words.append(i)
print words

このコードは、必要な形容詞、副詞、動詞のみを提供します。これらの単語をポジティブまたはネガティブに分類したいと思います。

4

1 に答える 1

1

感情分析に POS は必要ありません。少なくとも必須ではありません。X で bag_of_words を使用し、Y として "neg"/"pos" を使用して機能を準備します。次に、トレーニング/テスト セットに分割し、分類アルゴリズム (NaiveBayes、MaxEnt、RandomForest、SVM) を適用します。

于 2016-03-04T11:06:53.563 に答える