一定期間 (5 年間) にわたって少数の株式 (4) をモデル化するための GA を作成しました。GA がトレーニング データの最適な解をどれだけ迅速に見つけられるかは印象的ですが、これは主にトレーニング フェーズでオーバーフィットする傾向があるためであることも認識しています。
ただし、いくつかの予防策を講じて、同じ期間の一連の未確認のテスト株について何らかの予測を得ることができると考えていました.
私が取った予防措置の 1 つは、同じ日に複数の株を購入できる場合、GA はリストから 1 つだけを購入し、これをランダムに選択することでした。このランダム性は、過適合を避けるのに役立つと思いましたか?
オーバーフィッティングがまだ発生している場合でも、GA の初期世代にはまだオーバーフィッティングの機会がないため、GA が存在しないはずではありませんか?
注記として、私は、2 つの異なるデータセットに対して最適な出力を生成する完全なパラメーターのセットが存在しないことを示す (私が信じている) ノーフリーランチ定理を認識しています。これをさらに進めると、この無料ランチ定理も一般化を禁止するのでしょうか?
下のグラフはこれを示しています。→青線がGA出力です。->赤い線はトレーニング データ (前述のランダム性のためにわずかに異なります) -> 黄色い線は、一般化を示さない頑固なテスト データです。実際、これは私が作成できる最もお世辞のグラフです..
y 軸は利益、x 軸はそれぞれの利益 (y 軸上) に従って最悪から最良 (左から右) にソートされたトレーディング戦略です。
私がこれまでに受け取った最良のアドバイスのいくつか (seaotternerd に感謝) は、以前の世代に焦点を当て、トレーニング例の数を増やすことです。以下のグラフには、4 つではなく 12 のトレーニング ストックがあり、(1,000 ではなく) 最初の 200 世代のみが表示されています。繰り返しますが、これは私が作成できる最も魅力的なチャートです。今回は中程度の選択圧力です。確かに見た目は少し良くなりましたが、素晴らしいものでもありません。赤線はテストデータです。