c# - Kinect を使用した C# HMM ジェスチャ認識

Question

Kinect センサーを使用してジェスチャー認識を行うソリューションに取り組んでいます。現在、HMM のトレーニングに Accord .NET を使用しています。ジェスチャが保存されたデータセットがあります。このデータセットには 11 個のジェスチャがあり、それぞれに 18 ポイントが保存された 32 個のフレームがあります。

だから私は (double [12] [32,18]) 入力データセットと (int[12]) 出力データセットを持っていますが、そうすると: double error = teacher.Run(inputSequences, output), それは私にこれを与える: 「指定された引数は有効な値の範囲外です。」

誰もこれを解決する方法を知っていますか? 使用する前にデータセットを処理する必要があります o うーん先生で、またはデータセットはこのように問題ありませんか?

score 1 · Accepted Answer

私は過去に Accord.NET を使用してきましたが、これは HMM エンジンの最適な実装の 1 つです。しかし、私が HMM をトレーニングしたとき、整理された Excel シートを使用して提供された入力データセットを使用して、HMM パラメーター (つまり、PI、A、および B) を Baum Welch Teacher に渡しました。(Accord の作成者自身がプロジェクトで使用したものと同様です)。データセットを多次元配列として保存し、それを教師に直接提供しているため、適切に処理できないと感じています。一度に 1 つのジェスチャレコードを提供するか、データセットのストレージ構造を完全に変更することができます。私にとってはうまく機能したので、まだ行っていない場合は、Accord の例全体を確認することをお勧めします。

score 0 · Accepted Answer

問題は、教育アルゴリズムがトレーニングシーケンスがdouble[12][32][18]ではなくの形式であると想定していることdouble[12][32,18]でした。トレーニングデータは、多変量点のシーケンスのコレクションである必要があります。int[12]また、ジェスチャの可能なクラスが 11 ある場合、配列で指定された整数ラベルは 0 から 10 の間の値のみで構成される必要があることに注意する必要があります。

したがって、それぞれが 32 フレームを含む 12 個のジェスチャサンプルがあり、各フレームが 18 ポイントのベクトルである場合double[12][32][18]、観察を含むint[12]配列と予想されるクラスラベルを含む配列を教師に与える必要があります。

HiddenMarkovClassifierLearning ドキュメンテーションページから抜粋した以下の例は、ベクトルをどのように編成する必要があるかを理解するのに役立ちます。

// Create a Continuous density Hidden Markov Model Sequence Classifier 
// to detect a multivariate sequence and the same sequence backwards. 

double[][][] sequences = new double[][][]
{
    new double[][] 
    { 
        // This is the first  sequence with label = 0 
        new double[] { 0, 1 },
        new double[] { 1, 2 },
        new double[] { 2, 3 },
        new double[] { 3, 4 },
        new double[] { 4, 5 },
    }, 

    new double[][]
    {
            // This is the second sequence with label = 1 
        new double[] { 4,  3 },
        new double[] { 3,  2 },
        new double[] { 2,  1 },
        new double[] { 1,  0 },
        new double[] { 0, -1 },
    }
};

// Labels for the sequences 
int[] labels = { 0, 1 };

上記のコードでは、観測の 2 つのシーケンスの問題を設定しました。各シーケンスには 5 つの観測が含まれ、各観測は 2 つの値で構成されています。ご覧のとおり、これは double[2][5][2] 配列です。クラスラベルの配列は int[2] で指定され、0 から 1 の範囲の値のみが含まれます。

ここで、例をより完全なものにするために、次のコードを使用してモデルの作成とトレーニングを続けることができます。

var initialDensity = new MultivariateNormalDistribution(2);

// Creates a sequence classifier containing 2 hidden Markov Models with 2 states 
// and an underlying multivariate mixture of Normal distributions as density. 
var classifier = new HiddenMarkovClassifier<MultivariateNormalDistribution>(
    classes: 2, topology: new Forward(2), initial: initialDensity);

// Configure the learning algorithms to train the sequence classifier 
var teacher = new HiddenMarkovClassifierLearning<MultivariateNormalDistribution>(
    classifier,

    // Train each model until the log-likelihood changes less than 0.0001
    modelIndex => new BaumWelchLearning<MultivariateNormalDistribution>(
        classifier.Models[modelIndex])
    {
        Tolerance = 0.0001,
        Iterations = 0,

        FittingOptions = new NormalOptions()
        {
            Diagonal = true,      // only diagonal covariance matrices
            Regularization = 1e-5 // avoid non-positive definite errors
        }
    }
);

// Train the sequence classifier using the algorithm 
double logLikelihood = teacher.Run(sequences, labels);

これで、モデルをテストして、出力クラスラベルが実際に期待したものと一致することを確認できます。

// Calculate the probability that the given 
//  sequences originated from the model 
double likelihood, likelihood2;

// Try to classify the 1st sequence (output should be 0) 
int c1 = classifier.Compute(sequences[0], out likelihood);

// Try to classify the 2nd sequence (output should be 1) 
int c2 = classifier.Compute(sequences[1], out likelihood2);

c# - Kinect を使用した C# HMM ジェスチャ認識

2 に答える 2

Related

Reference