8

http://www.nltk.org/codeを使用して、幸せな気分または動揺した気分に関する文字列を判断する簡単な例を教えてください。

4

4 に答える 4

4

NLTKはすぐに使用することはできませんが、その分野に関連する調査を探している場合は、攻撃的な言語の検出に関するこのペーパーを参照してください。同じ方法を適用して、不快/不快ではなく、代わりに幸せ/不幸なコメントを検出することができます。このプロジェクトでテキスト分類に使用されている主要なソフトウェアパッケージはWEKAと呼ばれ、前の例でトレーニングされた複数の分類子を使用して、言語が不快かどうかを判断します(この方法では調整可能なしきい値を使用します)。

于 2010-08-12T13:22:48.717 に答える
2

Patternも試乗する価値のあるものです。プロジェクトのホームページで 2 つのオピニオン マイニングの実験を見ることができます。

http://www.clips.ua.ac.be/pages/pattern-examples-100days

http://www.clips.ua.ac.be/pages/pattern-examples-elections

于 2011-08-08T22:59:24.007 に答える
0

機械学習分類器を使用して、テキストの一部がポジティブかネガティブかを判断する手法を探しています。これについては、多くの研究チーム( http://research.yahoo.com/pub/2387http://lingcog.iit.edu/doc/appraisal_sentiment_cikm.pdfなど)によってさまざまな試みが行われています。製品レビューが肯定的か否定的かを判断する際の80%から90%の精度。

あなたの質問の簡潔さのために、製品レビューがポジティブかネガティブかを判断することがあなたが達成しようとしているのと同じタスクなのか、それとも単に関連するタスクなのかは私にはわかりませんが、バッグから始めることをお勧めします-ベイジアン分類器(NLTKが処理できるはずです)を使用した単語の分類を行い、精度がどのようになるかに応じて、そこから技術を向上させます。

残念ながら、私はNLTK(またはPython)を使用したことがないので、これにNLTKを使用する方法のコード例を示すことはできません。

于 2010-08-17T20:34:06.337 に答える
0

いいえ。

これは、NLTK や、既知の、または現実的に想像できる文法パーサーの機能をはるかに超えるタスクです。NLTK Bookを見て、それがどのような種類のタスクを達成できるかを確認してください。

安価な例として:

あなたの紙を使って私の犬を訓練するのは本当に楽しかったです。

それをNLTKで解析すると、取得できます

[('I', 'PRP'), ('really', 'RB'), ('enjoyed', 'VBD'), 
 ('using', 'VBG'), ('your', 'PRP$'), ('paper', 'NN'), 
 ('to', 'TO'), ('train', 'VB'), ('my', 'PRP$'), ('dog', 'NN')]

構文木は、'enjoyed' が単純な文の中心的な (過去形) 動詞であることを教えてくれます。何かを楽しむことは良いことです。何かを訓練することは、一般的に良いことです。動名詞、名詞、比較級などは比較的中立です。したがって、これに 0.90 の良いスコアを付けます。

私があなたの紙で私の犬を殴るか、あなたがおそらく良くないことだと思う紙の上に犬を排泄させることを本当に意味していることを除いて.

この認識タスクのために人を雇ってください。

訓練された分類器でさえ非常に有用であると想像する人のために追加されました:

好きなデータセットでトレーニングした好きな分類子を使用して、実際のカスタマー レビュー コーパスからこの実際のエントリを分類します。

このカメラはオートモードでオートフォーカスを続け、止められないブーンという音を立てます。このオートフォーカスを停止するオプションがあれば、本当に良いでしょう. 画像に日付と時刻が必要な場合は、画像のメタデータから画像の日付と時刻を読み取るソフトウェアのみを使用します。そのため、カード リーダーを使用して画像をコピーする場合は、日付と時刻を入力するために、もう一度ソフトウェアを使用して画像を開く必要があります。その場合も、日付と時刻を直接追加する方法はありません。日付と時刻を指定するオプションがある別のディレクトリに「画像を印刷する」と言う必要があります。ほんのわずかな揺れでも、あなたのイメージを完全に歪めます。屋内の画像はあまり鮮明ではありませんでした。フラッシュを「オン」にする必要があります あなたの部屋が明るくてもそれを得るために。レンズキャップは本当に面倒です。撮影されたムービー クリップには常に何らかの「ノイズ」が含まれます。これを避けることはできません。

私が得た最悪の気分分類は「完全にあいまい」でしたが、人間はこれが補完的ではないことを簡単に判断できます. これは無作為に選ばれたデータではなく、「嫌悪」や「suxz」などを含まない負のバイアスのために選択されたデータです。

于 2010-08-11T23:02:55.153 に答える