次の2つのうち、どちらが優れているかわかりません。
Classifier 1 - Training set = 100%, Test set 70%
と
Classifier 2 - Training set = 70%, Test set 75%
分類子1は分類子2よりも優れていると主張する必要があります。
どちらにも長所と短所がありますが、具体的な答えはありませんか?
次の2つのうち、どちらが優れているかわかりません。
Classifier 1 - Training set = 100%, Test set 70%
と
Classifier 2 - Training set = 70%, Test set 75%
分類子1は分類子2よりも優れていると主張する必要があります。
どちらにも長所と短所がありますが、具体的な答えはありませんか?
2番目の方がおそらく良いでしょう。
最初の分類器は明らかに過剰適合に苦しんでいます。言い換えれば、トレーニングセットの基本的な原則を学習するのではなく、データの詳細な説明を学習することです。
これは、2番目の分類器が優れているという意味ではありません。ただし、一般に、AのテストセットのパフォーマンスがBのパフォーマンスよりも優れている場合、分類器Aは分類器Bよりも優れています。
あなたが提供した詳細に基づくと、分類器1は分類器2と比較してトレーニングセットに過剰適合しているため、テストセットに対してパフォーマンスが低下しているようです。これは、分類器2がテストセットに関して「優れている」ことを示唆しています。
他の方法で議論したい場合は、分類子1について、それを可能にするいくつかの詳細を指摘する必要があります。たとえば、どのようにトレーニングされたか、どのアルゴリズムが使用されたかなどです。