0

私はこの形式のデータを持っています:

[(v1, A1, B1), (v2, A2, B2), (v3, A3, B3), ...]

sはvデータ要素に対応し、AsとBsはsを特徴付ける数値に対応しますv

このデータを見ている人間はそれを見て、どのタプルがAとのB値に従って最も「一致」しているように見えるかを確認できます。これらのタプルの1つを最適なものとして選択することでトレーニングでき、とに与えられる重みを調整できるAIの形式が必要AですB

基本的に、各タプルは値の近似値を表します。AエラーをB表し、各近似の複雑さを表します。エラーと複雑さの間に異なる重みを割り当てることで、妥協点を見つけたいと思います。さまざまな値の近似値を使用していくつかの試行を実行し、最も適切と思われるものを選択し、それに応じてAIに重みを調整させたいと思います。

4

1 に答える 1

1

あなたが説明したことは、モデル選択問題としても知られており、機械学習や統計でよく遭遇するものです。基本的に、ある程度の良さ (通常は誤差または対数尤度として測定) によってデータに適合するモデルがいくつかあり、それらのモデルには複雑さの尺度 (通常はモデル内のパラメーターの数) があります。最適なモデルを選択し、その複雑さにペナルティを課したいと考えています。これは、過剰適合の兆候である可能性があるためです。

通常、オーバーフィッティングによる影響の程度は、データのサイズによって決まります。ただし、モデルの適合性と複雑さを明示的にトレードオフできる手段がいくつかあります。

上記のように、データに基づいてモデルを選択すると、モデルの選択がデータに偏る可能性があります。したがって、これは通常、検証セットを使用して行われ、テスト セットで評価されます。

アルゴリズムにこの問題を解決させるというあなたのアプローチが良いものかどうかはわかりません。通常、それはデータとある程度の直感に依存します。私の意見では、あなたが説明したメタ機械学習手法は、おそらくあまり信頼できないでしょう。最初に、より原則的で単純なアイデアから始めることをお勧めします。

于 2013-03-23T04:57:11.060 に答える