問題タブ [mnist]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
881 参照

machine-learning - 手書き数字の散布図

0と1の手書き数字の散布図を作成したいと思います(http://yann.lecun.com/exdb/mnist/)。私は4つのサンプル、つまり2つの0と2つの1を取りました。

各手書き数字は、次元1のクロス778マトリックスを持つピクセル値を持っています。

次に、これらの数字を2次元で散布図して、分離可能かどうかを確認します。

それらをRでプロットしてみましたが、最終的なプロットはポイントの混合にすぎません。各桁の散布図が他の桁と異なって見えるようにするには、どのようにプロットしますか。プロットしながら正しい方向に進んでいますか?

お知らせ下さい。

0 投票する
2 に答える
1839 参照

machine-learning - 抽出済みの特徴を含む手書き数字データセット

手書きの数字データセットでいくつかのクラスタリング アルゴリズムをテストしたいと考えています。すでに特徴が抽出された手書きの数字データセットはありますか? たとえば、MNISTの場合のように、ブルート画像ピクセルの手書き数字データセットを検索しているわけではありません。そのようなデータセットから既に抽出されている特徴のベクトルを探しています。

0 投票する
3 に答える
5947 参照

c++ - C++ で MNIST データセットを読み取るにはどうすればよいですか?

次の質問を読んでいました。

C++ で MNIST データを読み取るには?

また、MNIST データベースを読み取るための C++ コードがいくつかありました。試してみると、データの読み取りを開始する場所までは正常に機能することがわかりました。

これは次のコードです。

変数「temp」の整数値を出力しようとしましたが、ピクセルの正しい数を取得できませんでした (すべてゼロでした)。何が問題なのかわかりません。各ピクセルは 1 バイトのスペースを取り、それを int に変換すると機能しません。なぜこれが起こるのですか?前もって感謝します

0 投票する
1 に答える
355 参照

matlab - 奇妙なニューラル ネットワーク分類現象

新しい重みの初期化方法を開発しようとしていますが、奇妙なトレーニング現象が発生しています。出力ノード 8 が最大アクティベーションではないことがわかります... ここに画像の説明を入力

tansig アクティベーション、mse パフォーマンス、およびバイアス ノードなしで matlab patternnet を使用しています。mnist データベースのサブセットを分類しようとしています。

これをトラブルシューティングする方法を知っている人はいますか? nguyen-widrow の初期化を使用しても、同じアーキテクチャを使用しているにもかかわらず、この結果は表示されません。

編集:

入力: 768xN の 0 ~ 1 の値

ターゲット: それぞれの行ごとに 0 または 1 の値の 10xN。つまり、列ごとに 1 つの true を持つロジック マトリックスのようなものです。

1 つ以上のノードがアクティブ化されません。最良のケースを示しました。

これは、1 つ以上のレイヤー (1 から 5)、少ないまたは多いトレーニング データ (1k から 10k サンプル) で発生します。

0 投票する
2 に答える
1673 参照

ocr - MNIST データセットの傾き補正

私は現在、数字の手書き認識問題に取り組んでいます。多くの最先端のアルゴリズムが、デスキューやジッタリングなど、mnist データセットにいくつかの前処理方法を採用していることがわかりました (「ジッタリング」とは何かはわかりません)。私は長い間グーグル検索しましたが、mnist dateset のデスキューに使用できる特定の方法やアルゴリズムについては何も見つかりませんでした。この問題を解決する方法についてアイデアを持っている人はいますか? どうもありがとう!

0 投票する
2 に答える
6501 参照

machine-learning - MNIST に類似したデータセットはありますか?

機械学習の研究をしています。次に、いくつかの有名なデータセットでアルゴリズムをテストしたいと思います。私はこの分野の初心者なので、MNIST 以外に適切なデータセットを見つけることができません。MNIST は私たちの研究に非常に適していると思います。MNIST と同様のデータセットを知っている人はいますか?

PS USPS データセットと呼ばれる、よく使用される別の手書き数字データセットを知っています。しかし、より多くのトレーニング例 (通常は 10000 を超え、MNIST のトレーニング例の数に匹敵する) を含むデータセットが必要なので、USPS は選択の対象外です。

0 投票する
1 に答える
1528 参照

python - PyDev が機械学習データを見つけられない

http://deeplearning.net/tutorial/gettingstarted.html#gettingstartedのチュートリアルに関して、誰かが私を助けてくれることを望んでいる問題があります。

コードを実行してデータセットをロードしようとすると、エラーが発生し続けます。これは、次のコードです。

私は PyDev で Eclipse を使用しており、numpy、Scipy、および Theano が動作しています。コマンドを実行して git リポジトリのクローンを作成し、指示に従ってデータ セットをダウンロードしましたが、上記のコードを実行しても返されます。

私は一般的にpythonを初めて使用しますが、問題の原因が何であるか、自分で解決するために何を検索するかさえわからないため、これは本当に困惑しています。

前もって感謝します。

0 投票する
1 に答える
4217 参照

python - MNIST および SGDClassifier 分類子

SGDClassifierを使用して MNIST 問題にオンライン (アウト オブ コア)学習アルゴリズムを使用しようとし ていますが、必ずしも精度が向上するとは限りません。

この場合、どうすればよいですか?どういうわけか最高の精度で分類器を保存しますか? SGDClassifier は何らかの最適解に収束していますか?

これが私のコードです:

トレーニングに 10k サンプル、テストに 10k サンプルを使用して MNIST で linearSVM と SGD をテストしたところ、0.883 13,95 と 0.85 1,32 が得られたため、SGD は高速になりましたが、精度が低下しました。

また、ここでいくつかの情報を見つけました https://stats.stackexchange.com/a/14936/16843

更新: データを 1 回 (10 回) 通過させると、最高の精度 90.8 % が得られました。これが解決策になる可能性があります。また、分類子に渡す前にデータをシャッフルする必要があるという SGD のもう 1 つの特異性。

0 投票する
2 に答える
502 参照

io - F# を使用した MNIST データセットの読み取り

私がすることができます; なぜそれが機能するのかわかりません。http://yann.lecun.com/exdb/mnist/からダウンロードした MNIST データベースと、そのページの下部にあるガイドラインを使用して、(まだ完成していない) メソッドを作成しました。

それは簡単な部分でした。難しいのはreadInt関数の形です。私はただ使うことはできませんBitConverter.ToInt(); 私はこのページで答えを見つけまし:

メソッドの翻訳

F# に

(仮定i = 4)。これは機能します: F# インタラクティブでは、次の行

最初のコード スニペットのコメントの値と一致する(2051, 10000, 28, 28)とそれぞれの結果を示します。(2051, 60000, 28, 28)

私が理解していないのは、なぜそれが機能するのかということです。ビットごとの or 演算子でのこのビットシフトとフォールディングは何ですか? BitConverter.ToInt()代わりに使用できないのはなぜですか?

0 投票する
2 に答える
7118 参照

python-2.7 - Theano 共有変数のデータへのアクセス

次のように、MNIST データセットを Theano 共有変数に正常にロードしました。

私の質問は、train_set_x と train_set_y の両方でデータにアクセスする方法です。データ セット内の各画像は 28 * 28 ピクセルです。これは長さ 784 のベクトルで、ベクトル内のすべての要素が 0.0 から 1.0 までの値を表す float です。各ベクトル画像に関連付けられたラベルを表し、0 から 9 までの値であるため、ラベルは int にキャストされます。train_set_x マトリックス画像と train_set_y ラベルをループして、各画像とそのラベルのデータを表示できるようにしたい個別に、最終的に画像を画面にプロットします。