1

0と1の手書き数字の散布図を作成したいと思います(http://yann.lecun.com/exdb/mnist/)。私は4つのサンプル、つまり2つの0と2つの1を取りました。

各手書き数字は、次元1のクロス778マトリックスを持つピクセル値を持っています。

次に、これらの数字を2次元で散布図して、分離可能かどうかを確認します。

それらをRでプロットしてみましたが、最終的なプロットはポイントの混合にすぎません。各桁の散布図が他の桁と異なって見えるようにするには、どのようにプロットしますか。プロットしながら正しい方向に進んでいますか?

お知らせ下さい。

4

1 に答える 1

2
  1. それらはおそらく分離可能であるため、実際に確認する必要はありません。

  2. 分離可能かどうかを知りたい場合は、SVM などの分類器を使用するのが正しい方法です。

    4 桁 (4x778) の次元を 2 次元 (4x2)に縮小しようとしています。それを行うには多くの方法があり、完璧なものはありません。次元を減らした後は常に一部の情報が失われるため、高次元データが分離可能かどうかを判断するおおよその方法にすぎません。

    データを 2 つ (または任意の数) の次元に縮小する最も一般的/単純な方法は、PCAと呼ばれます。

于 2012-01-21T00:21:06.830 に答える