1

特定のアクションのビデオ データセットがある場合、それらを使用して、後でこのアクションを分類するために使用できる分類器をトレーニングするにはどうすればよいでしょうか。

4

2 に答える 2

7

質問は非常に一般的です。一般に、すべてに対して機能する分類子をトレーニングするための絶対確実な方法はありません。作業しているデータに大きく依存します。

「一般的な」パイプラインは次のとおりです。

  • ビデオから特徴を抽出する
  • 特徴にラベルを付けます (探しているアクションには肯定的、そうでない場合は否定的)
  • データを 2 つ (または 3 つ) のセットに分割します。1 つはトレーニング用、1 つはテスト用、もう 1 つはオプションで検証用です。
  • ラベル付けされた例 (SVM、ニューラル ネットワーク、最近傍など) で分類器をトレーニングします。
  • アルゴリズムに適している場合は、検証データの結果を検証します
  • トレーニングに使用していないデータでテストします。

ここでいくつかの機械学習ツールから始めることができますhttp://www.cs.waikato.ac.nz/ml/weka/

テスト以外の目的でテストデータに触れないようにしてください。

幸運を

于 2012-08-18T22:06:10.593 に答える
0

ほぼ10年後、これが更新された答えです。

  1. カメラをセットアップして生のビデオ データを収集する
  2. 単一のフレームの形でどこかに保存します。これをローカルで行うか、クラウド バケットを使用するか、Sieve APIなどのサービスを使用します。ここにリンクされている役立つレポ。
  3. Sieve またはクラウド バケットからエクスポートして、ラベル付けされたデータを取得します。これを自分で行うか、Scale Rapidなどのサービスを使用してください。
  4. データセットをトレーニング、テスト、および検証に分割します。
  5. ラベル付きサンプルで分類器をトレーニングします。一部の既存のモデルに対して転移学習を使用し、最後の数層だけを微調整します。
  6. 各トレーニング エポックの後にテスト セットに対してモデルを実行し、テスト セットのパフォーマンスが最高のものを保存します。
  7. 検証セットを使用して、最後にモデルを評価します。

始めるのに役立つリポジトリがたくさんあります: https://github.com/weiaicunzai/awesome-image-classification

最良の結果を得るために役立つ 2 つの要素には、1.高品質のラベル付きデータと 2.多様で精選されたデータセットがあります。それがSieveがお手伝いできることです!

于 2021-12-21T19:07:33.707 に答える