問題タブ [confusion-matrix]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R conflictMatrix() & Table() は、sort.list(y) でエラーを返します: 'x' は 'sort.list' のアトミックである必要があります リストで 'sort' を呼び出しましたか?
できれば混乱行列()関数を使用して混同行列を作成しようとしていますが、次のエラーが発生します: sort.list(y) のエラー: 'x' は 'sort.list' のアトミックである必要があります' を呼び出しましたか?リストを並べ替えますか?
table() 関数も使用してみましたが、同じエラーが発生しました。
以下は私のコード全体です:
混乱マトリックス()を使用して混乱マトリックスを作成する際の助けをいただければ幸いです。
ありがとう
python - Python SKLEARN で混同行列を保存する
トレーニング データの 6 つの異なる値に対して 6 つの異なる混同行列を生成しています。生成された混同行列を画像として保存しようとしています。残念ながら、保存するとき、空の jpeg 画像として保存し続けます。ただし、show() を使用して表示すると、表示されます。これが私のコードです
次のライブラリを使用しています。
混同行列を効率的に保存するにはどうすればよいですか?
r - R 合計を使用した混同行列
実際の値と予測値を含むデータ テーブルがあります。混同行列は簡単に生成できますが、行列の各要素を 3 列目の合計にしたいと考えています。以下のコード例では、データ テーブルの各行を、実際の土地分類と予測された土地分類、および関連する領域を持つ多角形と考えることができます。混同マトリックスに、各ペアリングの面積の合計を表示してもらいたいです。
scikit-learn - Scikit - しきい値を変更して複数の混同行列を作成する
貸し出しクラブのデータを調べて、最適な X ローンを選択する分類子を構築しています。ランダム フォレストをトレーニングし、通常の ROC 曲線、混同行列などを作成しました。
混同行列は、分類器の予測 (森の中の木の多数派予測) を引数として取ります。ただし、10% の最良のローン、20% の最良のローンなどを選択した場合に何が起こるかを知るために、異なるしきい値で複数の混同行列を出力したいと考えています。
他の質問を読んで、しきい値を変更することはしばしば悪い考えであることを知っていますが、これらの状況で混同行列を確認する他の方法はありますか? (質問A)
しきい値の変更を進める場合、 proba を予測して手動でしきい値を設定し、それを Confusion Matrix に渡すのが最善の方法であると想定する必要がありますか? (質問B)
r - 列の R 混同行列の変更順序
混同行列の順序を反転させたい.ie行と列の1,0
これを変更するにはどうすればよいですか?
machine-learning - Apache Spark MLlib アルゴリズムのチューニング
Apche Spark Mllib Logistic Regression および Linear Regression アルゴリズムを使用しています。ドキュメントに記載されているコード スニペットを使用しています。最新バージョンの Spark 1.5 で LogisticRegressionWithSGD と LinearRegression を使用しているときに発生する問題。
LogisticRegressionwithSGDに使用したパラメーター値は次のとおりです。
Stepsize=0.01
反復回数 = 1000
minBatchFraction = 0.001
この値の混同行列は
LogisticRegressionWithLBFGSを使用した同じデータの場合、混同行列は次のようになります。
LogisticRegressionWithSGDの結果については完全に無知です。LogisticRegressionWithSGDで適切な結果が得られない理由を教えてください。
r - 「キャレット」の混同行列と正規化された相互情報量 (NMI): 線形判別分析、単純ベイズ、分類木
質問が長くなってしまい申し訳ありませんが、このページの大部分には、エラー メッセージを解決しようとするときの私の思考プロセスを説明するための段階的なコーディングが含まれています。「キャレット」を使用して、線形判別分析 (LDA)、単純ベイズ (NB)、および分類木 (CT) として知られる 3 つの教師あり機械学習アルゴリズムのトレーニング (70%) セットとテスト (30%) セットにデータを分割しました。 R でパッケージ化します (データとコードの再現可能な例を以下に示します)。したがって、各アルゴリズムは、100 回の実行で繰り返される 10 分割交差検証を使用してトレーニングされます。これは、応答変数の 2 つのクラスであるファミリー (つまり、"G8" と "V4")、12 の予測変数、および 80 の観測値を使用した探索的分類の演習です。これらの問題を解決し、エラーメッセージを理解するのに役立つ方法について誰かが洞察を持っている場合は、どうもありがとう. 私はRにやや慣れていないので、これは大歓迎です。
ゴール
私の目標は、「caret」パッケージの関数「confusionMatrix」を使用して混同行列を生成することです。私の目的は、この関数を使用して、カッパ係数、分類精度、感度、特異性、一方向仮説検定、および関連する統計を取得することです。混同行列から、正規化された相互情報量 (NMI) 係数を計算して、モデルのパフォーマンスを評価するつもりです。私のデータは「mydat」と呼ばれます (このページの下部にあります)。
問題
(1) 混同行列の場合、出力エラー メッセージは次のとおりです。
この問題を解決するためにコードのさまざまな組み合わせを試しましたが、問題を理解できません
(2) 私の NMI スコアはかなりずれており、0 から 1 の間にあるはずです。私のコーディングに注意点があるのか、それとも混同行列から NMI を計算するためのより簡単で直接的な方法があるのか疑問に思っていました (方程式は以下です)?
「caret」パッケージの関数「confusionMatrix」を使用して、LDA、NB、および CT の 3 つの別個の混同行列の混同行列統計を出力するという考え方です (以下の例)。
アルゴリズムと混同行列のコード
反復 10 倍線形判別分析
繰り返し 10 倍ナイーブ ベイズ
繰り返し 10 倍の分類木
混同行列のコードと付随するエラー メッセージ
各モデルで同じエラー メッセージが返され、オンラインやチュートリアルで検索しても問題を解決できません。
正規化相互情報量 (NMI)
参照: Fielding, AH & Bell, JF (1997) 保全の有無モデルにおける予測誤差の評価方法のレビュー。環境保全、24、38–49。
値 ad は、Kuhn (2015) による混同行列の上記の例から取得されました。
NMIコーディング
データ
r - 混同行列からテーブルを抽出する
次の混同行列があります (モデルの概要から取得summary (model)
):
次のように、マトリックスコンテンツだけを df1 に抽出したいと思います。
マトリックスのサイズは変更できることを考慮する必要があります。一般的な解決策が必要です。モデルとtxtファイルからも簡単に抽出する方法はありますか?
r - マルチクラス モデルの精度、適合率、および再現率
混同行列から各クラスのaccuracy、precision、およびrevokeを計算するにはどうすればよいですか? 埋め込みデータセット iris を使用しています。混同行列は次のとおりです。
トレーニング セットとして 75 個のエントリを使用し、その他のエントリをテスト用に使用しています。