特定の文/段落を面白いと分類する方法はありますか。これについてさらにどこに進むべきかについての指針はほとんどありません。
5 に答える
これに関する研究があり、 Computational Humorと呼ばれています。これは、計算言語学、心理言語学、人工知能、機械学習などの要素を取り入れた学際的な領域です。彼らは、ストーリーやジョークを面白くするものは何かを見つけようとしています (たとえば、予期しないつながり、またはタブーなトピックを意外な方法で使用するなど)。など)、それをテキストに適用します(面白いストーリーを生成するため、またはテキストの「面白さ」を測定するため)。
それに関する書籍や記事があります(例: Graeme Ritchieによる)。
はい、トレーニング コーパスを使用して、おかしな文章を検出できる予測モデルを構築する必要があります。これは、文献では「感情分析」として知られていることがあります。LingPipe を使用した感情分析に関するこの記事をご覧ください。
Java を使用できる場合は、そのライブラリを使用できます (ライセンス マトリックスを参照)。あなたとまったく同じコンテキストではなく、非常に便利だと思いました。
これを成功させる唯一の方法は、2,000 人 (サルは無理です、ごめんなさい) に何千もの面白い文章/ストーリーを見てもらい、それらを評価してもらい、何らかの専門家システム/ニューラル ネットワークを構築することです。それ。問題の範囲とその主観性 (ある人にとって面白いことは別の人にとっては面白くないかもしれません - 攻撃的でさえあるかもしれません) を考えると、それは不可能な作業だと思います。
また、この分野への参入を真剣に考えている場合は、 Computational Humor @ Google Scholarを試してください。感情分析についても言及されています。それについてはウィキペディアを参照してください。
もちろん、これはすべて、あなたの範囲と目的が何であるかに依存します...
スパム フィルターと同じ手法を使用できます。スパム/非スパムの代わりに、面白い/面白くないで分類します。詳細については、単純ベイジアン分類器を調べてください。