感情を検出するように訓練されたオープンソースのニューラル ネットワークはありますか?
ビデオ/オーディオ クリップやテキストから否定性を検出するために使用できるかどうかを確認したいと思います。
感情を検出するように訓練されたオープンソースのニューラル ネットワークはありますか?
ビデオ/オーディオ クリップやテキストから否定性を検出するために使用できるかどうかを確認したいと思います。
これは私がクリップに対して想像する方法です - 問題をより小さなものに分けます:
動画で人が笑っているかどうかを確認することに集中できます。まず、顔を検出するアルゴリズムを使用します。次に、これらの顔のランダムな (時間内の) サンプルをいくつか作成します。次に、別のアルゴリズム (訓練されたニューラル ネットワーク) を使用して、数字の形で彼らが笑っているかどうかを確認します: n サンプル中 p 個の笑顔が検出されました。
音声認識を使用して、彼らが笑っているのか泣いているのかを確認します。
うなずきを確認してください (一部の国では逆になっていることに注意してください。ただし、今はこの部分をスキップできます)。
クリップが大きな音で始まり、そのように終わるかどうかを確認します。
これら 4 つ (例) を認識したら、それらの上にニューラル ネットワークをトレーニングすることができます。
笑顔、ポジティブなうなずき、大声でスタート -> ポジティブ
良いサンプル データは、チームの勝敗を発表するスポーツ コメンテーターです。
実際、彼らが何を言っているのかわからない場合、これはすべて良いことです.これは、すべてのYouTubeビデオをチェックしたいが、世界中のすべての言語を学びたくない場合です.
オーディオまたはビデオ用に作成することもできますが、特に効果があるとは思わないと言わざるを得ません. ニューラル ネットワークは、パターン認識に優れています。ネットワークはどのパターンに合わせて調整されますか? 「喜び」や「怒り」の音とは?