“cross-entropy”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

229 参照

tensorflow - Tensorflow R0.12 softmax_cross_entropy_with_logits ASSERT エラー

私は、「softmax_cross_entropy_with_logits」を 147 クラスの問題のコスト関数の一部として機能させることに取り組んできました。「sigmoid_cross_entropy_with_logits」で動作するコードがありますが、softmax に移行したいと考えています。

ランク 3 からランク 2 に変更してコードを機能させるために、さまざまな試みを何度も試みましたが (役に立ちませんでした)、立ち往生しました。ノートブックでいくつかのおもちゃのコードを試してみましたが、softmax_cross .... はエラーをアサートしません。また、float32 を float64 にキャストしようとしましたが (ノートブックの例では 64 ビットを使用して動作していたため)、それでもエラーがアサートされました。

おもちゃのコードは次のとおりです。

これが私のコードフラグメントです:(サイズは以下にエラーで印刷されています)

私がやろうとしているのは、結果ごとに2つのエンコードされた「単語」があるため、単語ごとに個別にエラーを計算しようとしていますが、まだ機能しませんでした. 上記の最初の行でエラーが発生します。

ここで何が起こっているのでしょうか？エラーは「範囲」機能によるものと思われますが、何が間違っているのかわかりません。

tensorflow cross-entropy

2016-12-16T20:37:04.343

0 投票する

1 に答える

11973 参照

tensorflow - Tensorflow - 損失が高く始まり、減少しない

私はテンソルフローでニューラルネットワークを書き始めましたが、サンプルプロジェクトのそれぞれに直面しているように見える問題が1つあります。

私の損失は常に 50 かそれ以上から始まり、減少しないか、減少したとしてもゆっくりと減少するため、すべてのエポックの後、許容可能な損失率に近づくことさえできません。

すでに試したこと（結果に大きな影響はありませんでした）

過適合でテストされていますが、次の例では、15000 のトレーニングと 15000 のテストデータセット、および 900 のニューロンのようなものがあることがわかります
さまざまなオプティマイザーとオプティマイザー値をテストしました
テストデータをトレーニングデータとしても使用して、トレーニングデータを増やしてみました
バッチサイズを増減してみました

https://youtu.be/vq2nnJ4g6N0の知識でネットワークを作成しました

しかし、私のテストプロジェクトの1つを見てみましょう:

名前のリストがあり、性別を仮定したかったので、生データは次のようになります。

それをネットワークに供給するために、名前をcharCodeの配列に変換し（最大長は30を想定）、性別をビット配列に変換します

出力層として [30,20]、[20,10]、[10,10]、[10,2] の 3 つの隠れ層を持つネットワークを構築しました。すべての隠れ層には活性化関数として ReLU があります。出力層にはソフトマックスがあります。

次に、損失、精度、およびトレーニング操作の計算を行います。

100 のバッチでネットワークをトレーニングします

そして、次の結果が得られます。

私は何を間違っていますか？

私のプロジェクトで ~69 から始まり、それ以下にならないのはなぜですか?

どうもありがとうございました！

2016-12-21T09:41:06.233

0 投票する

10 に答える

183058 参照

tensorflow - TensorFlow のロジットという単語の意味は何ですか?

次の TensorFlow 関数では、最終層で人工ニューロンの活性化をフィードする必要があります。私は理解しています。しかし、なぜロジットと呼ばれるのかわかりませんか？それは数学関数ではありませんか？

tensorflow machine-learning neural-network deep-learning cross-entropy

2017-01-04T02:02:31.570

0 投票する

1 に答える

138 参照

machine-learning - Crossentroy 損失と精度の関係

画像分類タスクで CNN をトレーニングしています。単純なバージョンではこれで問題なく動作しましたが、画像をより難しくすると、次の現象に遭遇しました (一晩かけてトレーニングさせました)。

トレーニング中、トレーニングクロスエントロピー損失は減少します。また、私のテストデータセットでは、クロスエントロピー損失が減少します。私はさらに精度を測定していますが、動作が異なります。最初は上がり、また下がるだけで、その後は 0.1 から 0.3 の間で揺れていました。私はクロスエントロピーの損失と精度が多少関連していると予想していました - それらは両方とも同じテストデータセットで測定されているからです。

誰かが私にこれを説明できますか？または、コードに誤りがありますか?

どうもありがとう

machine-learning tensorflow conv-neural-network cross-entropy

2017-02-16T10:40:43.557

0 投票する

1 に答える

75 参照

python - バイナリログ損失は、y に基づく方程式の一部を除外しますか?

対数損失の方程式を次のように仮定します。

logLoss=−(1/N)*∑_{i=1}^N (yi(log(pi))+(1−yi)log(1−pi))

ここでN、はサンプル数、yi...yiNは従属変数の実際の値、はpi...piNロジスティック回帰から予測された尤度です

私はそれをどのように見ていますか：

もしそうならyi = 0最初の部分yi(logpi) = 0

あるいは、yi = 12 番目の部分(1−yi)log(1−pi) = 0

だから今、方程式の一部の値に応じてy除外されます。私はこれを正しく理解していますか？

私の最終的な目標は、ログ損失の結果を解釈する方法を理解することです。

python machine-learning logistic-regression sklearn-pandas cross-entropy

2017-02-17T22:58:04.607

問題タブ [cross-entropy]

tensorflow - Tensorflow R0.12 softmax_cross_entropy_with_logits ASSERT エラー

tensorflow - Tensorflow - 損失が高く始まり、減少しない

tensorflow - TensorFlow のロジットという単語の意味は何ですか?

machine-learning - Crossentroy 損失と精度の関係

python - バイナリログ損失は、y に基づく方程式の一部を除外しますか?

Reference