1

人間が手を振っているのか、走っているのか、歩いているのかを判断するアプリケーションがあります。アイデアは、アクション、たとえばハンドウェーブをそのポーズにセグメント化したということです。まあ言ってみれば

例;

for human1:pose7-pose3-pose7-..... represents handwave
for human3:pose1-pose7-pose1-..... represents handwave
for human7:pose1-pose1-pose7-..... represents handwave
for human20:pose3-pose7-pose7-..... represents handwave

for human1 pose11-pose33-pose77-..... represents walking
for human2 pose31-pose33-pose77-..... represents walking
for human3 pose11-pose77-pose77-..... represents walking
for human20 pose11-pose33-pose11-..... represents walking

そして、MatlabでSVMとNeural Netをトレーニングするために上記のベクトルを使用しました..

今、私はそれを使ってテスト画像をテストします。ここでも、テスト画像のポーズをセグメント化しました。

MATLAB のテスト セットとトレーニング セットのベクトル サイズ。SVM とニューラル ネットでは、同じベクトル サイズが必要です。それを機能させるには;
0 を追加するとpose0(-これは無効なポーズであると仮定します)、サイズを等しくするために、非常に優れたパフォーマンスが得られます。
最初に最初のポーズをコピーし、サイズが等しくなるまで最後に追加すると、パフォーマンスが低下します。

例えば;

train set: pose1-pose2-pose4-pose7-pose2-pose4-pose7
(1st method)test set: pose3-pose1-pose4-0-0-0-0 or
(2nd method)test set: pose3-pose1-pose4-pose3-pose1-pose4-pose3

追加された値はポーズの実際の値であるため、2番目の方法でより良い分類が期待できます。しかしpose0、本当のポーズではありません。

あなたはなにか考えはありますか ?よろしく

4

2 に答える 2

2

あなたの場合、データは、それぞれがいくつかの機能(PoseSlot1、PoseSlot2、...、PoseSlotNのようにslotをポーズ)とクラス値(手を振る、走る、歩く)を持つインスタンスのコレクションで構成されます。

問題は、機能の数がすべてのクラスで同じではないことです。たとえば、ランニングには7つのポーズがあり、ウォーキングには3つのポーズがあります。

この種の問題に対処する標準的な方法は、機械学習アルゴリズムが欠落値を処理できると仮定して、これらの空のスロットを欠落値でマークすることです。

f1     f2    f3    f4    f5    f6    f7    class
-------------------------------------------------
pose1,pose2,pose4,pose7,pose2,pose4,pose7,running
pose3,pose1,pose4,    ?,    ?,    ?,    ?,walking

さて、あなたが追加に使用した最初の方法pose0は、欠落値に使用することを単純化し?たものです(明示的な値の代わりに欠落値を示すために新しいポーズを追加するのと同様?です)

値を繰り返す別の方法は、考えれば問題を解決するのではなく、実際に問題を引き起こします。実際には、相関する特徴を作成しています。ご存知のように、ほとんどの機械学習アルゴリズムは、独立した特徴のセットで最適に機能します(通常は前処理ステップとして特徴選択を実行する)

于 2010-01-12T22:40:59.043 に答える
2

最初の方法からより良いパフォーマンスを得ることが不合理だとは思いません。より良い分類と同様に、より良いパフォーマンスを意味していると思います。この理由は、通常、手を振るシーケンスが短いためだと思います。したがって、「無効な」ポーズで埋めると、実際のポーズよりも、無効なポーズが含まれているかどうかによって、さまざまなアクションを区別しやすくなります。

于 2010-01-12T12:21:01.287 に答える