特定のアクションのビデオ データセットがある場合、それらを使用して、後でこのアクションを分類するために使用できる分類器をトレーニングするにはどうすればよいでしょうか。
質問する
1113 次
2 に答える
7
質問は非常に一般的です。一般に、すべてに対して機能する分類子をトレーニングするための絶対確実な方法はありません。作業しているデータに大きく依存します。
「一般的な」パイプラインは次のとおりです。
- ビデオから特徴を抽出する
- 特徴にラベルを付けます (探しているアクションには肯定的、そうでない場合は否定的)
- データを 2 つ (または 3 つ) のセットに分割します。1 つはトレーニング用、1 つはテスト用、もう 1 つはオプションで検証用です。
- ラベル付けされた例 (SVM、ニューラル ネットワーク、最近傍など) で分類器をトレーニングします。
- アルゴリズムに適している場合は、検証データの結果を検証します
- トレーニングに使用していないデータでテストします。
ここでいくつかの機械学習ツールから始めることができますhttp://www.cs.waikato.ac.nz/ml/weka/
テスト以外の目的でテストデータに触れないようにしてください。
幸運を
于 2012-08-18T22:06:10.593 に答える
0
ほぼ10年後、これが更新された答えです。
- カメラをセットアップして生のビデオ データを収集する
- 単一のフレームの形でどこかに保存します。これをローカルで行うか、クラウド バケットを使用するか、Sieve APIなどのサービスを使用します。ここにリンクされている役立つレポ。
- Sieve またはクラウド バケットからエクスポートして、ラベル付けされたデータを取得します。これを自分で行うか、Scale Rapidなどのサービスを使用してください。
- データセットをトレーニング、テスト、および検証に分割します。
- ラベル付きサンプルで分類器をトレーニングします。一部の既存のモデルに対して転移学習を使用し、最後の数層だけを微調整します。
- 各トレーニング エポックの後にテスト セットに対してモデルを実行し、テスト セットのパフォーマンスが最高のものを保存します。
- 検証セットを使用して、最後にモデルを評価します。
始めるのに役立つリポジトリがたくさんあります: https://github.com/weiaicunzai/awesome-image-classification
最良の結果を得るために役立つ 2 つの要素には、1.高品質のラベル付きデータと 2.多様で精選されたデータセットがあります。それがSieveがお手伝いできることです!
于 2021-12-21T19:07:33.707 に答える