SFrame でデータセットをインポートしました。
products = graphlab.SFrame('amazon_baby.gl')
products['word_count'] = graphlab.text_analytics.count_words(products['review'])
以下に示す一連の単語に対して感情分析を行いたいと思います。
selected_words = ['awesome', 'great', 'fantastic', 'amazing', 'love', 'horrible', 'bad', 'terrible', 'awful', 'wow', 'hate']
次に、製品マトリックスで選択した単語ごとに新しい列を作成したいと思います。エントリはそのような単語が出現する回数であるため、「awesome」という単語の関数を作成しました。
def awesome_count(word_count):
if 'awesome' in product:
return product['awesome']
else:
return 0;
products['awesome'] = products['word_count'].apply(awesome_count)
ここまではうまくいきましたが、この方法で選択した単語ごとに他の関数を手動で作成する必要があります。