問題タブ [multiclass-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
345 参照

scikit-learn - マルチラベル分類 sklearn

私はsklearnと機械学習が初めてです。ID-2001-0001、ID-category_1 ID-2002 - 0002、ID-category_2 のタイプのマッピングを含む csv ファイルがあります。. 1010 の一意の ID と 123 の一意のカテゴリがあります。今、私は約 1000 の他の ID を分類したいと考えています。すでに分類されている 800/1010 ID の分類器をトレーニングしたいと考えています。私はsklearnを使用しています。SVM を使用すると、残りの 200 個の ID について同じ予測が得られます。GradientBoosting を使用すると、約 1.4% の精度が得られます。これはデータサイズが小さいためでしょうか。基本的には、100 次元のベクトルと ID-2001-0001 (word2vec) とそれに対応するカテゴリを fit メソッドに渡します。

私はこの分類を正しく行っていますか? または、何か不足していますか? どんな助けにも感謝します。ありがとう

0 投票する
1 に答える
607 参照

matlab - 最も近い重心分類器は本当に非効率的ですか?

私は現在、Ethem Alpaydin による「Introduction to machine learning」を読んでおり、最も近い重心分類器に出くわし、それを実装しようとしました。分類子を正しく実装したと思いますが、68% の精度しか得られません。それで、最も近い重心分類器自体は非効率的ですか、それとも実装にエラーがありますか (以下) ?

データ セットには 1372 個のデータ ポイントが含まれ、それぞれに 4 つの特徴があり、2 つの出力クラスがあります My MATLAB implementation :

0 投票する
0 に答える
432 参照

python - SMOTE を使用するときにバランスを取るクラスを決定する

SMOTE (imblearn.over_sampling import SMOTE) を使用して、一部のクラスが非常に不均衡なマルチクラス分類問題を解決しています。現在、いくつかの反復を通じて観測値が最も少ないクラスをオーバーサンプリングするループを作成しました。ライブラリはデフォルトで、サンプルが最も少ないクラスを取得してオーバーサンプリングしますが、オーバーサンプリングするクラスを決定したいと思います。ライブラリがこのオプションをどのようにサポートしているかわかりません - 何かアイデアはありますか?

私のコード: