進化的計算とは何ですか?強化学習の方法ですか?または、機械学習の別の方法ですか?または多分なし?
この質問に答えるために使用された参考文献を引用してください。
進化的計算とは何ですか?強化学習の方法ですか?または、機械学習の別の方法ですか?または多分なし?
この質問に答えるために使用された参考文献を引用してください。
強化学習の問題を解決することを明確に目的とした進化的方法があります。サブフィールドは通常、Learning Classifier Systems(LCS)または場合によってはGenetics-Based Machine Learning(GBML)の名前で呼ばれます。
それを除けば、あなたの質問が非常に明確な答えを持っているかどうかはわかりません。基本的には「機械学習とは」ということです。その質問に答える方法について私たち全員が同意した規範はありません。一部の人にとって、ECはそのサブフィールドの一部である可能性があります。他の人にとってはそうではありません。棚から数冊のML教科書をサンプリングしたところ、約半分に進化論的手法に関する資料が含まれていました。15年前は分数がもっと高かったと思いますが、流行は変わり、機械学習は現在、統計のサブフィールドに非常に近いものになっています。ECメソッドはその型にうまく適合しません。
進化的計算、または進化的アルゴリズムは最適化アルゴリズムであり、(ニューロエボリューションのように)ニューラルネットワークに適用すると、通常の強化学習アルゴリズムとは少し異なりますが、強化学習の形式として確実に分類できます。
一般に、遺伝的アルゴリズムや進化戦略などの進化的アルゴリズムでは、最適化する必要のある個人の集団全体があります。それらの個人のそれぞれについて、品質関数を使用して「適者生存」を決定し(「適者生存」のように)、次世代のために最良の個人を選択します。次に、これらの「親」はランダムに複製、変更、変更、または相互に再結合されます。これがどのように正確に行われるかは、アルゴリズムごとに少し異なります。最後に、これらの新しい突然変異および/または組換えられた親は、次世代の集団を形成し、いくつかの望ましい品質に達するか、品質が横ばいになるまで、プロセスが再開されます。
ニューロエボリューションの場合、個人はニューラルネットワークであり、ランダムに重みを変更するか(従来のニューラルネットワークでは、重みは非常に正確な数学的規則に従って更新されます)、トポロジや個人の品質を変更することで変化します。トレーニングデータでどれだけうまく機能するかによって決まります。
申し訳ありませんが、ここには確かな科学的参考資料はありませんが、それでも少し問題を解決するのに役立ったのかもしれません。
強化学習[1]と進化的計算[2]の主な違いは、元の意味でのRLが環境内のエージェントに適用され、ポリシーを学習することです(強化学習に関するWikipediaの記事も参照)。検索を最適化するために「進化的」に触発された方法を使用する検索アルゴリズムのクラスの総称。ECを機械学習として分類することはまったくなく、分類するソースも見つかりませんでした。
[1]強化学習:はじめに-RS Sutton、AG Barto-1998-Cambridge Univ Press
[2]進化的計算とは何ですか?-DB Fogel-スペクトラム、IEEE、2000
2017年現在の更新:答えは「はい」です。「強化学習のスケーラブルな代替手段としての進化戦略」と適切に名付けられた、強化学習で過去1か月間に最もダウンロードされた論文は、確かに町の話題です。
では、進化的計算はどこにあるのでしょうか?強化学習の方法ですか?または、機械学習の別の方法ですか?または多分なし?
私はECとMLを互いに区別していると考えています。ただし、それらを組み合わせて使用する優れたアプリケーションがいくつかあります。これはかなり前から小さな研究分野でしたが、ECとMLを組み合わせる分野には、手に負えない成果があると感じています。多くの人はそれらのアイデアを見抜く忍耐力を持っていないと思います。