画像をビジュアル ワードのヒストグラム表現に変換することができました。次のような単純なもの(正規化されたもの)になる可能性があります。
[0.1, 0.2, 0, 0.1, 0, 0.05, 0.3, 0, 0, 0, 0.2, 0.05, 0]
合計すると 1 になります
今、上記のヒストグラムのさまざまな反復がある場合、libsvm で分類したいと思います。しかし、私はここで立ち往生しています.svmtrainの構文を知っています:
model=svmtrain(label,training_matrix)
トレーニング行列は、すべてのヒストグラムの amxn 行列である必要がありますが、ラベルはどうですか? +1 または -1 であることはわかっていますが、ネガティブなイメージはどこから来るのでしょうか? training_matrix 内のすべてが、クラスを表す正のイメージである必要があります。
各ヒストグラムを個別のインスタンスとして扱うのは間違っていますか? 代わりに、すべての視覚的な単語をインスタンスとして扱うと、クラスを表す単語からネガが得られます。