問題タブ [svmlight]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
probability - SVMLight マルチクラス分類の判別値を確率スコアに変換する方法はありますか
4 つのクラスを持つ分類器をトレーニングするために、SVM Light マルチクラス分類器を使用しています。分類段階では、分類子は予測されたラベルと 4 つのクラスのスコアを出力します。SVM Light の Web サイトにあるように、これらのスコアは「k クラスごとの判別値」です。各クラスの確率値をユーザーに表示したい。したがって、これらの値を確率値または少なくとも0と1の間の正規化されたスコアに「変換」できる数学的なトリックまたは他の方法があるかどうか疑問に思っていましたか?
svm - svm light のトレーニング セット
分類にsvm lightを使いたいです。
そのサイトにあった例では、ファイル形式は次のとおりです。
この形式が理解できません。と は何line
をvalue
指していますか? 以下は、トレーニング セットの例の一部です。
1
データの最初の行で正の出力を6
参照していることを知っています。 を参照してくださいtarget
。target
を参照してくださいword
。を0.0198403253586671
参照してくださいvalue
。value:0.0198403253586671
しかし、これがどのように計算されるかわかりません。
svm - libsvm の未分類のデータ ポイント?
SVM のチュートリアルでは、データ ポイントが区切り線の周囲の領域 (余白) にある場合、それは分類されないと述べています。これは、SVMlight や libsvm などのライブラリでどのように実装されていますか?
machine-learning - SVMlight トレイン データのフォーマット
svm light を使用してロイターのテキストを分類しようとしていますが、列車のデータがフォーマットに従っていません
<'行> .=. <'target> <'feature>:<'value> <'feature>:<'value> ... <'feature>:<'value> # <'info>
それは形です
<'行> .=. <'機能>:<'値> <'機能>:<'値> ... <'機能>:<'値> # <'情報>
ターゲット ラベルは別のファイルにあります。SVM ライトには別のターゲット ラベル ファイルを指定できるオプションがあることは知っていますが、エラー メッセージが表示されるため、SVM ライトの Web サイトで見つけることができません。
例をメモリに読み込んでいます...行はラベルまたは 0 で開始する必要があります!!!
を使用してトレーニング データをロードするたびに
svm_learn example1/train.dat example1/モデル
何か助けはありますか?
machine-learning - Arff から SVM ライト
SVMLight 形式に変換したい weka arff を作成しました。これは、arff をMLCompにロードできるようにするためです。どうすればarffを変換できますか?
machine-learning - SVM-light の結果を解釈する方法
データを2つのクラスに分類するためにチュートリアルで書かれているように、SVM-lightを使用しています。
トレーニング ファイル:
そしてテストファイル:
実行することでsvm_learn.exe train_file model
->svm_classify.exe test_file model output
で予期しない値が得られますoutput
:
列車ファイルのクラスとして正確に +1 または -1 である必要はありませんか? または、-1 と +1 の間のある種の浮動小数点数を使用して、分類または別の数値の解決策として 0 を手動で選択しますが、私にとっては、すべての数値が -1 に近く、一部が -1 に近い場合はかなり予期しない状況です。少ないも。
UPD1:結果の数値が負の場合はそのクラス-1
、正の場合は -と言われてい+1
ます。記号の後のこの値が何を意味するのか、まだ疑問がありますか? 私は SVM の探索を始めたばかりなので、簡単な、または愚かな質問かもしれません :) そして、かなり悪い予測が得られた場合、どのような手順を踏む必要がありますか - 別のカーネルですか? または、SVM-light を私のデータにより関連性のあるものにするための他のオプションはありますか?
machine-learning - SVM-light メモリ不足エラー
私は研究に SVM-light を使用していますが、問題なく動作しています (少なくともまだ処理中です)。
ここの Learn_data は、20.000 の特徴を持つ約 14.000.000 行のデータです。
しかし、-z p
ランキング モードのフラグに関しては、1.000.000 行のデータでクラッシュします。
結果として:
現在の設定は 64GB の RAM で、SVM がすべてを使用しようとしているようには見えません。20000までのキャッシュとして4000 MB以上を使用しようとしました。しかし、それは役に立たず、キャッシュエラーである場合、SVMはメモリエラーだけでなくキャッシュについても通知する必要があります。それを解決するための文書化された方法が見つかりませんでした。データを処理するにはどうすればよいですか?
r - R - データ フレームを featureName:featureValue としてフォーマットされたデータ セットに変換します。
私が欲しかったフォーマットは「SVM-Light」と呼ばれ、ここで説明されていることがわかりましたhttp://svmlight.joachims.org/。
次のような形式のテキスト ファイルに変換したいデータ フレームがあります。
たとえば、次のようになります。
次のようになります。
これまでの私のコード:
しかし、結果を完成させてテキスト ファイルに書き込む方法がわかりません。また、コードはおそらく効率的ではありません。
これを行うライブラリ関数はありますか?この種の出力形式は、たとえば Vowpal Wabbit では一般的なようです。
opencv - SVM 分類子のテストは、トレーニング セットよりも大きな画像でのみ機能します
初めて、静止画像のオブジェクト検出用の sw を実装しています。私の最初の目標は、単純な円を検出することです。次に、より複雑なオブジェクトに移動します。残念ながら、分類子を検証するときに問題があるようです。
私の選択は、HOG 記述子 (OpenCv を使用) と svm を分類子として (svmlight を使用) 使用することでした。コードはコンパイルされて動作しますが、おそらく svm に関して、私には奇妙に聞こえることがあります。
私は持っている:
- 48x48px の異なる円の 5 つの画像と 48x48px の円以外の 5 つの画像で構成されるトレーニング セット (確実な分類子を作成するには、それらの画像が少なすぎることはわかっていますが、すべてが機能することをテストするためのものです)
- 48x48 ピクセルの 4 つの画像 (トレーニングに使用したものと同じ大きさの円) と、複数のサイズの円やその他の幾何学的形状を含む、はるかに大きい (765x600 ピクセル) 1 つの画像で構成されるテスト セット。
何が起こるかというと:
- 画像が 48x48 の場合、トレーニング フェーズで使用される画像がテスト セットに含まれていても、テスト セットの円は検出されません。
- 画像 765x800 (任意のサイズの円を含む) では、トレーニング セットと同じサイズまたはそれより大きい円が正しく識別されます。
次のパラメータを使用しています。
- 独り占め: winSize=48x48px、winStride=4x4px、cellSize=4px、blockSize=8px、blockStride=4x4px
- 分類子: C=0.01 の線形分類子を使用した svm 回帰。(RBF の結果は線形よりも悪い)
これは、私が使用しているパラメーターで検出を実行する API です。
48x48px の画像の円が検出されず、大きな画像の円が検出される理由はありますか? 分類子を検証するために、48x48px の画像が正しく分類されることを期待しています。48x48px の画像で何も検出されない場合は、より大きな画像を追加しました。
さらに、奇妙に聞こえるのは、48x48ps のテスト セットには、トレーニング セットで使用されている画像がいくつかあり、それらを特定する必要があると思いますが、そうではありません! (トレーニング セットとテスト セットが異なる必要があることはわかっていますが、何も検出されなかったときにそれを行いました。)
Hog 記述子と svm を使用するのはこれが初めてなので、構成エラーまたはイメージの選択が原因で機能しない可能性があります。
どんな助けでも大歓迎です!
前もって感謝します :)