1

このトピックには多くのスレッドがあります。しかし、私は別のものも投稿しています。すべての投稿は感情分析を行うための方法かもしれませんが、方法が見つかりませんでした.

感情分析の方法を実装したいと思います。だから私は私に方法を示すように要求します。調査中に、これがとにかく使用されていることがわかりました。ベイジアンアルゴリズムを使用して、肯定的な単語と否定的な単語を計算し、bag of words を使用して文章が肯定的または否定的である確率を計算していると思います。

これは言葉だけで、言語処理もしないといけませんね。では、もっと知識のある人はいますか?はいの場合、実装できるように、参照用のリンクを含むいくつかのアルゴリズムを案内してもらえますか。特に私の分析に役立つ可能性のあるものは何でも。

また、私が使用できる言語を選択できますか? Java は比較的時間がかかるため、Java を使用することを推奨しないという人もいます。

どんな種類の助けも大歓迎です。

4

3 に答える 3

5

まず、センチメント分析は、ドキュメント、センテンス、フレーズ、機能レベルなど、さまざまなレベルで行われます。どれに取り組んでいますか?それぞれに多くの異なるアプローチがあります。このトピックの非常に優れた紹介をここで見つけることができます。機械学習のアプローチの場合、最も重要な要素は特徴量エンジニアリングであり、言葉の袋に限定されません。リンクしたチュートリアルから、さまざまなアプリケーションで他の多くの便利な機能を見つけることができます。どの言語処理を行う必要があるかは、使用する機能によって異なります。たとえば、機能に POS 情報が必要な場合は、POS タグが必要になることがあります。

分類器については、Support Vector Machines、Maximum Entropy、および Naive Bayes (おそらくベースラインとして) を試すことができます。これらは文献で頻繁に使用されており、リンクでかなり包括的なリストを見つけることもできます。Mallet ツールキットには ME と NB が含まれており、SVMlight を使用すると、関数を使用してフィーチャ形式を Mallet 形式に簡単に変換できます。もちろん、これらの分類器には他にも多くの実装があります。

ルールベースの方法では、ポイントごとの相互情報が頻繁に使用され、いくつかの種類のスコアリングベースの方法などが使用されます。

お役に立てれば。

于 2012-02-13T15:19:08.730 に答える
1

テキスト分析において、SNOBOL ほど強力な言語はありません。たとえば、SNOBOL-4 では、Fortran インタプリタは 60 行しか必要としません。

于 2012-02-13T20:28:39.163 に答える
0

NLTK は、感情分析に非常に優れたアルゴリズムを提供します。オープン ソースなので、ソース コードを見て、使用されているアルゴリズムを確認できます。無料の NLTK ブックをダウンロードすることもできます。感情分析に関する優れた資料が含まれています。

2番目のポイントに来て、Javaがそれほど遅いとは思いません。私は何年もの間 C++ でコーディングしていますが、最近は Java から始めました。Lucene、solr、hadoop、neo4j などの非常に人気のあるオープン ソース ソフトウェアの多くがすべて Java で記述されているのを目にするかのようです。

于 2012-02-13T17:25:39.453 に答える