“gradient-descent”の関連問題_Stack Overflow日本語サイト

0 投票する

4 に答える

193 参照

algorithm - 遺伝的アルゴリズム: 突然変異の場所を駆動する部分に名前を付ける

質問を設定するために、例から始めましょう。

1000 個の配列 (別名、行ベクトル) のセットがすべて同じ長さであるとします。それぞれに -1 から 1 までの乱数が入ります。次に、これらの行ベクトルを 500 個ランダムに取り出して合計します。合計から始めて、元の 1000 からの選択をリバースエンジニアリングしたいと考えています。

これを遺伝的アルゴリズムで解決することにしました。1000 ビット長のビット文字列のファミリを開始し、変異 (別名、ランダムビットの反転) とクロスオーバーの手順を実行します。10 分の 1 秒後、75% 正解です。それからさらに 1 時間後、76% 正解です。基本的に、数十ビットが正しく設定されるのを永遠に待っています。私の乱数ジェネレーターは、ソリューションにマージできる方法でそれらを導入しない可能性があります。

このアルゴリズムは、最初は非常にうまく機能しますが、ソリューションをさらに改善することはできません。私は、私の遺伝的ファミリーが可能なすべてのビット位置の1つを持っていることを確認しようとしました. それは役に立ちませんでした。アイテムがプールから消える速さを判断することはできません。

アルゴリズムには追加のコンポーネントが必要なようです。フリップビット (別名、ミューテーション) の位置の選択を駆動する何かがあるに違いありません。この作品の専門用語は何ですか? 勾配？それはどこから来たのですか？

2013-06-25T12:25:59.827

0 投票する

1 に答える

3968 参照

artificial-intelligence - ANN: 極小値を回避するために初期重みを正しく選択する方法は?

バックプロパゲーショントレーニングでは、誤差曲面を下る勾配降下中に、隠れ層に大量のニューロンを含むネットワークが局所的最小値でスタックする可能性があります。すべての場合に重みを乱数に再初期化すると、最終的にこの問題が回避されることを読みました。これは、「正しい」初期重み値のセットが常に存在することを意味します。（これは想定しても安全ですか？）

それらを見つけるアルゴリズムを見つけるか、作成する必要があります。

私はアルゴリズムをグーグルで調べてみましたが、自分で考案しようとしましたが、役に立ちませんでした。誰でも解決策を提案できますか? おそらく私が検索できるアルゴリズムの名前ですか？

注：これは通常のフィードフォワード3層ブリトーです:)

注: その目的で GA を使用する試みが行われたことは知っていますが、ネットワークが十分に大きくなると、反復ごとにネットワークを再トレーニングする必要があり、時間がかかります。

前もって感謝します。

artificial-intelligence neural-network gradient-descent

2013-07-02T10:11:07.743

0 投票する

4 に答える

183015 参照

python - Pythonとnumpyを使用した勾配降下

上記のコードからの私のシータはですが、正しい matlab にある100.2 100.2はずです。100.2 61.09

python numpy machine-learning linear-regression gradient-descent

2013-07-22T09:55:30.337

0 投票する

2 に答える

707 参照

machine-learning - バックプロパゲーション、すべての出力は 1 になる傾向があります

MATLAB でこのバックプロパゲーションを実装していますが、トレーニングに問題があります。トレーニングフェーズの早い段階で、すべての出力が 1 になります。入力データ (バイナリターゲットベクトルの生成に使用される目的のクラスを除く) を間隔 [0, 1] に正規化しました。私は、Artificial Intelligence: A Modern Approach、Norvig et al. での実装について言及してきました。

私のコードに対して疑似コードをチェックした(そしてしばらくの間アルゴリズムを研究した)が、エラーを見つけることができません。私は MATLAB をそれほど長く使用していないので、必要に応じてドキュメントを使用しようとしています。

また、隠れ層のさまざまな量のノードとさまざまな学習率も試しました ( ALPHA)。

ターゲットデータのエンコーディングは次のとおりです。ターゲットがたとえばとして分類される場合2、ターゲットベクトルは[0,1,0]、それが1だっ[1, 0, 0]たとします。1また、（たとえばクラスの場合）など、ターゲットにさまざまな値を使用してみました[0.5, 0, 0]。

体重の一部がを超え1、正味の値が大きくなっていることに気付きました。

machine-learning artificial-intelligence neural-network backpropagation gradient-descent

2013-08-04T23:15:47.043

0 投票する

4 に答える

26218 参照