問題タブ [mnist]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
1872 参照

python - 「mnist.pkl」で使用されている正確な形式とデータ構造で、データセットを .pkl ファイルに入れる方法は?

mnist.pkl と同じ形式で画像のデータセットを作成しようとしています

https://github.com/dmitriy-serdyuk/cats_vs_dogs/blob/master/cats_vs_dogs/make_dataset.pyを参照として使用しました。

これは私がこれまでに持っているものです

問題に直面しているセクションを強調表示しました。次のエラーが発生し続けます:

メイン画像では、label = cPickle.load(fin)
ValueError: unpack する値が多すぎます

誰か助けてくれませんか?

0 投票する
2 に答える
1370 参照

machine-learning - MNIST データセットでトレーニングされた CNN を使用した数字認識のパフォーマンスの低下

データセットを使用して数字認識のためにCNN(on )をトレーニングしました。テスト セットの精度は に近かった。tensorflowMNIST98%

自分で作成したデータを使って数字を予測したかったのですが、結果が悪かったです。

私が書いた画像に私は何をしましたか?

各桁を分割してグレースケールに変換し、画像のサイズを変更28x28してモデルに入力しました。

テスト セットの精度が高いのに、データ セットの精度がこれほど低いのはなぜですか?

画像に加える必要がある他の変更はありますか?

編集:

画像といくつかの例へのリンクは次のとおりです。

数字の 7 のイメージ 数字の 5 数字の 9 数字の6

0 投票する
2 に答える
26333 参照

python - グレースケール画像をピクセル値のリストに変換するには?

グレースケールの24 * 24ピクセルの画像ファイル(タイプを決めていないので、提案を歓迎します)を取り、0(白)から255までのピクセル値のリストに変換するpythonプログラムを作成しようとしています(黒)。

この配列を使用して、Tensor-Flow 手書き認識アルゴリズムで認識できる画像のMNISTのようなバイトファイルを作成する予定です。

各ピクセルを繰り返し処理し、その値を配列に追加することにより、 Pillowライブラリがこのタスクで最も役立つことがわかりました

ただし、このソリューションには 2 つの問題があります。

  1. ピクセル値は整数として保存されるのではなく、数学的にこれ以上操作できないため役に立たないピクセル オブジェクトとして保存されます。
  2. 枕のドキュメントでさえ、次のように述べています。

    個々のピクセルへのアクセスはかなり遅いです。画像内のすべてのピクセルをループしている場合は、Pillow API の他の部分を使用するより高速な方法がある可能性があります。

0 投票する
1 に答える
237 参照

ios - MPS (MetalPerformanceShaders) を使用して Flatten フィルターを作成するには?

iOS で MNIST の CNN 推論を実行する作業を行っています。Apple から開始するための適切なコード サンプルがあります。 https://developer.apple.com/library/content/samplecode/MPSCNNHelloWorld/Introduction/Intro.html#//apple_ref/doc/uid/TP40017482-Intro-DontLinkElementID_2

しかし、非常に複雑な CNN モデル (例: https://github.com/fchollet/keras/blob/master/examples/mnist_cnn.py ) を MPS を使用して実装しようとすると、「Flatten」のクラスがないことがわかりました。フィルター。

MPS フレームワークを調べて、ディメンションを再形成または変更する関数を見つけましたが、適切な関数が見つかりませんでした。(たとえばMPSImageConversion、色の変換のみのようで、寸法の変換はできません。

Flatten のフィルターや、多次元画像を 1D 画像に変換する方法を知っている人がいたら教えてください。

0 投票する
0 に答える
465 参照

machine-learning - 一定の初期化を伴う CNN がまったく学習するのはなぜですか?

通常、ニューラル ネットワークの重みはランダムに初期化されるため、異なる勾配を受け取り、異なる重みを学習します。理論的には、すべての重みが同じ方法で初期化されている場合、トレーニングの期間に関係なく、すべてのノードの重みが同じになります。したがって、トレーニングはまったく機能しないはずです。

ただし、以下のコードでは、7000 エポック後の MNIST で 56% の精度が得られます。なぜそうなのですか?

コード

プロット

番号 1

用語を追加10**-7した後tf.log(..)、NAN はなくなりました。

ここに画像の説明を入力

ここに画像の説明を入力

番号 2

log(0)これは、 16k エポック以降に問題があった古いプロットです。

損失は​​ここにプロットされます。三角形は NAN です。

ここに画像の説明を入力

精度は次のとおりです。平滑化により、直接 10% まで低下することはありません。

ここに画像の説明を入力

0 投票する
1 に答える
1423 参照

python - tensorflow メモリ MNIST チュートリアル

Tensorflow Web サイトから MNIST チュートリアルを完了しようとし ています。2 GB の geforce 760gtx があり、毎回メモリが不足しています。スクリプトの最後にあるこれらのコード行で、バッチ サイズを削減しようとしました。

ただし、常に同じ量の RAM を使用しようとします。私は tensorflow を初めて使用します。質問したいのですが、この例のどこでメモリ使用量を減らすことができますか、または CPU を介してそれをプッシュするコードはありますか?

完全なコード:

0 投票する
1 に答える
363 参照

deep-learning - mnist ケースのオートエンコーダー モデルにおけるデコーダー層の定義

このブログに記載されている例に従って、オートエンコーダー モデルを構築しようとしています。

私が行った変更は、元の投稿のdecoder = Model(input=encoded_input, output=decoded)ように書かれた です。decoder = Model(input=encoded_input, output=decoder_layer(encoded_input))以前のバージョンは、単一の非表示レイヤーで機能します。そのため、上記の変更を行いました。ただし、上記のモデルをコンパイルすると、次のエラー メッセージが表示されます。どんな提案でも大歓迎です。

0 投票する
1 に答える
30 参照

neural-network - 3 層 NN から ReLU によるディープ ラーニングへの移行

正しく理解できていれば、 afterを追加してから+を繰り返すことで、 a3-Layered NNを a に変換できます。DL NNRelUthe hidden layerhidden layerRelU

次元がどのように機能するかを視覚化するのに苦労しています。私は今、私がまとめている小さなライブラリから次のものを持っているので、概念に没頭することができます

でも行きたい

関連記事これについて書いています

0 投票する
1 に答える
862 参照

python - Tensorflow MNIST チュートリアルを理解する - 入力 xa 列行列または列行列の配列ですか?

Tensorflow MNIST チュートリアルに従っています。

理論/直感のセクションを読んxで、入力が列行列であることを理解するようになりました。

実際、 を記述する場合softmaxxは列行列として示されます。

x が列行列として明確に示されている、softmax の直感

ただし、 で宣言されたtensorflowx は次のようになります。

xこれは、可変長 ( None ) の配列であり、この配列の各要素はサイズ 784 の列行列であると読みました。

は列行列の配列として宣言されていますxが、単なる列行列であるかのように使用されます。

この例では、Wbは直観的に形状の変数として[784, 10]および[10]それぞれ宣言されていますが、これは理にかなっています。

私の質問は次のとおりです。

  1. Tensorflow は、x の各列行列に対してソフトマックス演算を自動的に実行しますか?

  2. [None, value] は、直観的に、各要素がサイズ値の配列である可変サイズの配列を意味すると仮定するのは正しいですか? または、[None, value] が単にサイズ値の配列を意味することは可能ですか? (コンテナ配列に含まれていない場合)

  3. x は列ベクトルで、x は列行列の配列である理論的な説明を実装にリンクする正しい方法は何ですか?

ご協力いただきありがとうございます!

0 投票する
0 に答える
460 参照

python-3.x - MNIST データをダウンロードできません - tensorflow チュートリアル

このコードを試すと

PermissionError: [Errno 13] Permission denied: 'C:\Users\Username\AppData\Local\Temp\some_random_alphanum_folder' が発生します (もちろん Username と some_random_alphanum_folder は実名ではありません) 管理者モードでも試してみましたがだめでしたヘルプ。私のテンソルフローのバージョンはCPUのみ、Windowsの場合は0.12rc0、python 3.5、pythonのバージョンは3.5.2です

編集: tensorflow 0.12.0 rc1 で修正