問題タブ [sentiment-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 感情分析のための Mahout
mahout を使用して、データの感情を分類できます。しかし、私は混乱行列に悩まされています。
mahout 0.7 単純ベイズ アルゴリズムを使用して、ツイートのセンチメントを分類しています。単純なベイズ分類器を使用trainnb
しtestnb
て分類器をトレーニングし、ツイートのセンチメントを「ポジティブ」、「ネガティブ」、または「ニュートラル」に分類します。
サンプル ポジティブ トレーニング セット
同様にネガティブとニュートラルのトレーニングサンプルを用意しましたが、膨大なデータセットです。
私が提供しているサンプル テスト データのツイートには、感情は含まれていません。
mahout 分類アルゴリズムを実行することができ、分類されたインスタンスを混同行列として出力します。
次のステップでは、ポジティブな感情を示しているツイートとネガティブな感情を示しているツイートを特定する必要があります。分類を使用して予想される出力: テキストに感情のタグを付ける。
mahout では、上記の形式で出力を取得するためにどのアルゴリズムを実装する必要がありますか。またはカスタム ソースの実装が必要です。
データを「親切に」表示するには、apache mahout が提供するアルゴリズムを提案してください。これは、私の Twitter データのセンチメント分析に適しています。
python - アラビア語コーパスの作成
アラビア語の感情分析を行っています。独自のコーパスを作成します。そのために、Facebookから300のステータスを収集し、それらをポジティブとネガティブに分類します。次に、これらのステータスのトークン化を行います。単語のリストを作成し、ユニグラムとバイグラム、トリグラムを生成し、クロスフォールド検証を使用するために、私は今のところnltk pythonを使用していますが、このソフトウェアはアラビア語またはラピスからこのタスクを実行できますか? Minnerの方がうまくいくでしょう、あなたはどう思いますか、そして私はどのようにバイグラム、トリグラムを生成し、クロスフォールド検証を使用するのか疑問に思っています、何かアイデアはありますか?
python - Sentiment Analysis on LARGE collection of online conversation text
The title says it all; I have an SQL database bursting at the seams with online conversation text. I've already done most of this project in Python, so I would like to do this using Python's NLTK library (unless there's a strong reason not to).
The data is organized by Thread, Username, and Post. Each thread more or less focuses on discussing one "product" of the Category that I am interested in analyzing. Ultimately, when this is finished, I would like to have an estimated opinion (like/dislike sort of deal) from each user for any of the products they had discussed at some point.
So, what I would like to know:
1) How can I go about determining what product each thread is about? I was reading about keyword extraction... is that the correct method?
2) How do I determine a specific users sentiment based on their posts? From my limited understanding, I must first "train" NLTK to recognize certain indicators of opinion, and then do I simply determine the context of those words when they appear in the text?
As you may have guessed by now, I have no prior experience with NLP. From my reading so far, I think I can handle learning it though. Even just a basic and crude working model for now would be great if someone can point me in the right direction. Google was not very helpful to me.
P.S. I have permission to analyze this data (in case it matters)
nlp - ウェブサイトのベンチマークを実行する方法は?
私は、ある国の州レベルで不動産ドメインに蔓延しているオンライントレンドの競争分析を行おうとしています。特定の企業に偏っていないレポートを作成する必要がありますが、トレンドのリストについて企業がどのように業績を上げているかを比較または表示するだけです。のパラメータを使用Clickstream analysis
して、会社のWebサイトのパフォーマンスの統計を表示します。Sentiment Analysis
私の意見では、トレンド固有のパフォーマンスを表すことができます。効果的な方法でそれを行う他の方法があれば、私はそのようなアプローチを楽しみにしています。
今、私は共通する傾向を見つけることができません。
- すべての不動産会社に共通する一般的な傾向をどのように見つけることができますか?
使ってみGoogle Trends
ました。それらは、特定の検索用語に関するグラフィカルおよび人口統計情報を提供し、私が使用方法がわからない検索に関連する用語をリストします。そして、国から州へとドリルダウンすると、データ量は非常に少なくなります。
トレンドがわかったら、人々がそれらのトレンドにどのように反応しているかを見つける必要があります。Sentiment Analysis
私にこの情報を提供するものです。
- しかし、トレンドを取得したとしても、その極性を計算できるトレンド固有のデータをどのように取得しますか?
Twitterやその他のソーシャルメディアサイトは、感情分析を実行できるデータを提供できます。ツイッターのある用語に関連するポジティブ、ネガティブ、ニュートラルな行動を与えるこのサイトを使用しました。これに類似したものが必要ですが、この分析を実行できるデータセットはソーシャルメディアのみに限定されるべきではありません。
- この競合分析レポートに追加できる他のエンティティはありますか?
レポートは毎月生成されます。そして、上記のタスクで最大限の自動化が必要です。同様の形式のデータをスクレイピングするためにもWebスクレイピングを使用することを考えています。また、どのデータをスクレイプする必要があり、どのデータを手動で抽出する必要があるのかを知りたいです。
java - アラビア語の感情分析
私はアラビア語でセンチメントを分析することを探しています。それを行うために、Facebook からステータスを収集し、それらをポジティブとネガティブに分類します。私のコーパスが絵文字「 :( and :) 」を肯定的および否定的な感情と見なすこと、それを私のコーパスに追加する方法。
これは私が使用したモデルであり、スマイリーを肯定的および否定的な感情として扱うために組み込む必要がある演算子
groovy - ツイッターからデータを抽出する
私はリアルタイムでツイートを抽出したいのですが、RapidmMiner を使用してセンチメント分析を行っています。データを収集するために、ツールを使用して Twitter から自動的にツイートを抽出することを好みます。weka を使用した json を使用した groovy でこのタスクを達成できると思います。しかし、それを行うためのチュートリアルが見つかりませんでした。他に簡単なツールはありますか?
nlp - 感情分析で文脈依存文法を使用する方法は?
感情分析で文脈依存文法を使用することは可能ですか? はいの場合、どのように?基本的には、フレーズ レベルの分析を行いたいと考えています。
java - mahout で単純ベイズ分類器を使用して感情分析用の独自のモデルを作成する方法は?
私は魔法使いの初心者です。mahout で単純ベイズ分類器を使用して感情分析用の独自のモデルを作成する方法がわかりません。ログデータに基づいて感情分析を行う独自のモデルを作成したいと考えています。これを行うための段階的な手順はありますか。実装する必要があるクラスと、モデルの作成方法、または mahout で既存のモデルを使用する方法などです。どんな助けでも大歓迎です。前もって感謝します。
python - アジア言語の感情分析のコード例 - Python NLTK
sentiment analysis
ここにNLTK
(python)のデモがありますhttp://text-processing.com/demo/sentiment/。
また、センチメント分析の部分に関するチュートリアル
- http://streamhacker.com/2010/06/16/text-classification-sentiment-analysis-eliminate-low-information-features/
- http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/
- http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html
アジア言語の感情分析に関する python NLTK を使用した完全なコード例または作業中のプロジェクトはありますか? (特に中国語、日本語、韓国語、アラビア語、ヘブライ語、ペルシャ語の場合)
java - JAVAでCURLから応答を受信する
小さなテキストがポジティブ、ネガティブ、ニュートラルのいずれであるかを見つけるために、Sentiment-140が提供するパブリックAPIを使用しています。単純なHTTP-JSONサービスは正常に使用できますが、CURLで失敗します。これが私のコードです:
私は何が間違っているのですか?