問題タブ [svmlight]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - svnlight からの結果モデルを解釈する
平面で 3D の 2 クラスのいくつかのポイントを分離したいのですが、これはサポート ベクター マシン (SVM) を使用して可能であると考えました。
そこで、次のデータ ファイル (data.txt) を svmlight で分析するように設定しました。
実行する:
残念ながら、モデルの解釈方法と分離面の記述方法がわかりません。
手伝ってくれますか?
java - java eclipseでsvm lightを実行するには?
Java で svm を実行するための JNI_SVM-light-6.01-64bit バージョンをダウンロードしました。オンラインで検索してみましたが、Java 用の Eclipse IDE を使用してライブラリを実行する手順が正確にわかりませんでした。モデルをトレーニングするための入力トレーニング ファイルを提供する方法と、対応する結果を取得するためのテスト ファイルを提供する方法を知りたいだけですか? Eclipse IDEを使用してそれを行うための段階的な指示は非常に役立ちます.
r - R : Rsofia は sparse.model.matrix を SVM-light 形式に変換します
~ 25kR x 10C のデータセットがあります。いくつかの列には、カテゴリ変数に多数のレベルが含まれています。RSofia パッケージを使用してデータ セットを SVM-Light 形式に変換しようとしていますが、次のエラーが発生します。
sparse.model.matrix
パッケージを使用してデータセットをオブジェクトに正常に変換しましたが、オブジェクトMatrix
から SVM-Light 形式のファイルを書き込めるかどうか知りたいですsparse.model.matrix
。
私のコードは以下の通りです:
このコードを実行するとエラーが発生します。
助言がありますか?
svm - SVM 実装におけるしきい値 b
私は、固有の二次計画問題を解決するために cvxopt を使用して、SVM の独自の大まかな実装をいじっていました。私は SVM の初心者です。
これは私自身の実装であるため、マージンサポートベクトルと分離平面のしきい値 b を把握する責任は私にあります。かなりのサイズ (約 5K サンプル、2 次元の数値入力) のデータ セットで、ソフト SVM 形式で、マージン サポート ベクターを見つけようとしているときに問題に遭遇しました。
マージン サポート ベクターは、C よりも小さいゼロ以外のアルファです。ただし、cvxopt の feastol パラメータをやみくもに使用して、C とみなすことができるアルファと C よりも小さいとみなすことができるものを決定すると、しきい値 b が各マージンから導出されることがわかりました。サポート ベクターはかなり異なり、場合によっては著しく異なります。(理論的には、マージンサポートベクトルのいずれかから導出されたしきい値 b は同じであると想定されています)
アドホックなしきい値処理が機能する場合もありますが、実行できない場合もあります。さまざまなしきい値を巧みに試して、「最も一貫性のない」bのセットなどを取得する方法があるかもしれません。
(a) そのような状況は、実際の実践者 (または libsvm や svm-light などの「内部」実装) によって実際に遭遇したのか、それとも私の特定のケースではバグや実装の問題のように聞こえますか?
(b) これが実際に問題である場合、どのように解決されますか: Burges による SVM チュートリアルでは、マージン サポート ベクターから導出されたすべてのしきい値の平均を取るだけであると述べています。 Gunn の技術レポート ( http://www.ecs.soton.ac.uk/~srg/publications/pdf/SVM.pdf )。それは簡単な方法であり、実際にはうまく機能しますか?これは libsvm や svm-light などで行われていることですか? または、さまざまなしきい値を試して、一貫性のない許容可能なしきい値のセット b を取得する原則的な方法はありますか?
machine-learning - SVM ライトのトレーニングとテスト ファイル
テキスト分類の問題に SVM を使用しようとしています。SVM light と呼ばれる SVM 実装とその派生 SVM multiclass (2 つ以上のクラスの分類問題用) を見つけました。ただし、分類子をトレーニングおよびテストするためのファイルの形式を実際に理解することはできません。特徴ベクトルを作成する必要があることを理解しています (ドキュメント内の各単語を特徴と見なすと仮定します)。次に、各ドキュメントに対して、そのクラス、含まれる特徴 (実際には特徴のインデックス) を指定する必要があります。特徴ベクトル) と特徴値を使用して、トレーニング ファイルを作成します。この「機能値」について混乱しています。それは何でしょうか?このドキュメントのその機能の数ですか? それとも別のものですか?Web サイトに含まれるトレーニング ファイルの例には、特徴値として整数が含まれていません。これは、特徴値を形成する頻度ではないことを示しています。
また、単純なドキュメントからこの列車ファイルを作成するためのツール/ソフトウェアがあるかどうかも疑問に思っていました。私は通常、Java を使用しています。したがって、これを行うJavaのパッケージでも十分です。Google で検索してみましたが、関連するものが見つかりませんでした。
また、テキスト分類に SVM を使用する他のより良い方法があるかどうかも知りたいです。
この点で何か助けていただければ幸いです。
machine-learning - Libsvm モデル ファイル形式 型番なし
ドキュメントの分類に libsvm を使用しています。プロジェクトで svm.cc と svm.h を使用しています。次に、svm_train を呼び出します。svm_save_model を使用してモデルをファイルに保存します。
私はそこにカテゴリを持っています。svm モデル ファイルは次のとおりです。
index:value の形式のベクトル値の前の 1 と -1 は何ですか?
python-2.7 - Python Svmlight エラー: DeprecationWarning: 整数の代わりに整数以外の数値を使用すると、将来的にエラーが発生します
Mac OSX Mountain Lion で scikit_learn-0.14 を使用して python 2.7.5 を実行しています。
ただし、svmlight コマンドを実行すると、次の警告が表示されます。
DeprecationWarning: 整数の代わりに整数以外の数値を使用すると、エラーが発生します >将来的に