問題タブ [multiclass-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1072 参照

tensorflow - Tensorflow tf.metrics.accuracy マルチラベルは常にゼロ

私のラベルは次のようになります。

つまり、クラス 1、4、5 が対応するサンプルに存在します。これはソフトクラスと呼ばれるものだと思います。

私は自分の損失を次のように計算しています:

Tensorboard によると、予想どおり、損失は時間の経過とともに減少しています。ただし、精度はゼロでフラットです。

ソフト クラスを使用する場合、モデルの精度を計算するにはどうすればよいですか?

0 投票する
1 に答える
853 参照

random-forest - マルチクラス ランダム フォレスト

決定木が 2 つのクラスに分割される場合、ランダム フォレストはどのようにして分類で複数のバケットを作成できますか? この理論に関するリンクを投稿できますか? その背後にある理論は何ですか?

0 投票する
1 に答える
1588 参照

r - R を使用した多クラス テキスト分類

マルチクラスのテキスト分類問題に取り組んでいます。同じための勾配ブースティングモデルを構築しました。

データセットについて:

データセットには、"Test_name" と "Description" の 2 つの列があります。

Test_Name 列には 6 つのラベルがあり、"Description" 列には対応する説明があります。

問題に対する私のアプローチ

データ準備

  1. 説明用の単語ベクトルを作成します。

  2. 単語ベクトルを使用してコーパスを構築します。

  3. 数字、空白、ストップワードの削除、小文字への変換などの前処理タスク。

  4. ドキュメント ターム マトリックス (dtm) を作成します。

  5. 上記の dtm からまばらな単語を削除します。

  6. 上記のステップにより、対応する列の各単語の頻度を示すカウント頻度マトリックスが得られます。

  7. カウント頻度マトリックスをバイナリ インスタンス マトリックスに変換します。これは、ドキュメント内の単語の出現を 0 または 1 として示します。存在する場合は 1、存在しない場合は 0 です。

  8. 変換された dtm を使用して、元のメモ データセットのラベル列を追加します。ラベル列には 6 つのラベルがあります。

モデル構築

H2o パッケージを使用して、gbm モデルをビルドします。

得られた結果

クラス ラベルのうち 4 つは適切に分類されていますが、残りの 2 つは適切に分類されていません。

以下は出力です:

臓器機能検査と患者関連の誤分類誤差は比較的高くなります。どうすればこれを修正できますか?