森林ポリゴンのデータセットがあり、混同行列を使用してフィールド分類とマップ分類を比較しようとしています。大規模なデータセット (2 つ以上の分類オプション) で実行され、テキスト値を比較できる唯一のパッケージは、パッケージ 'mda' にありました。パッケージ「mda」を実行し、「混乱」のコードを使用しました。
パッケージで提供される例は...
data(iris)
irisfit <- fda(Species ~ ., data = iris)
confusion(predict(irisfit, iris), iris$Species)
Setosa Versicolor Virginica
Setosa 50 0 0
Versicolor 0 48 1
Virginica 0 2 49
attr(, "error"):
[1] 0.02
私は単純に私のものを実行します
data(Habitat)
confusion(Habitat$Field,Habitat$Map)
これにより、提供されたコード例と同様の (ただし、それほどきれいではない) 混同行列の出力が得られます。この時点で私は道に迷います。私は私のもので2つの結果を持っています。
attr(,"error")
[1] 0.3448276
attr(,"mismatch")
[1] 0.889313
エラーはわかりましたが、不一致ですが、オンラインまたはパッケージに付属の文献の中にヒントが見つからないようです。「不一致」の値がこれほど高いのは良いことではないと思いますが、それをどのように解釈すればよいかわかりません。これはおそらく、以前にこのパッケージを扱ったことのある人だけが答えることができるかなり具体的な質問だと思いますが、誰かが知っているか、見つける方法についてのヒントを持っているなら、私は大いに感謝します.
ありがとう、アイデン
編集- 私のデータセットのクリップを含めて、何が不一致であるかを示します (一貫した誤分類を意味すると思われます)。最も一貫性のある誤分類のクリップを表示します。
structure(list(Field = structure(c(7L, 7L, 7L, 7L, 7L, 7L, 7L,
7L, 7L, 7L, 7L, 7L, 7L, 8L), .Label = c("Black Spruce ", "Clearcut ",
"Deciduous ", "Jack Pine ", "Lowland Conifer ", "Marshwillow ",
"Mixed Conifer ", "Open Muskeg ", "Rock ", "Treed Muskeg ", "Upland Conifer ",
"Young Conifer", "Young Deciduous"), class = "factor"), Map = structure(c(7L,
7L, 7L, 11L, 11L, 11L, 11L, 11L, 11L, 12L, 13L, 13L, 13L, 6L), .Label = c("Black Spruce", "Clearcut", "Deciduous", "Jack Pine", "Lowland Conifer", "Marshwillow",
"Mixed Conifer", "Open Muskeg", "Rock", "Treed Muskeg", "Upland Conifer",
"Young Conifer", "Young Deciduous"), class = "factor")), .Names = c("Field",
"Map"), row.names = 143:156, class = "data.frame")