0

トレーニング セットからトレーニングする機械学習アルゴリズムを考えてみましょう。PAC 学習モデルの助けを借りて、必要なトレーニング サンプル サイズの範囲が得られるため、エラーが (イプシロンによって) 制限される確率は (デルタによって) 制限されます。

PAC学習モデルは、計算(時間)の複雑さについて何を言っていますか。学習アルゴリズムにより多くの時間 (より多くの反復など) が与えられると仮定すると、エラーとエラーが制限される確率がどのように変化するか

トレーニングに 1 時間かかる学習アルゴリズムは、金融予測の問題では実用的ではありません。エラー境界とエラーが制限される確率の両方の観点から、アルゴリズムに与えられた時間が変化するにつれてパフォーマンスがどのように変化するかが必要です

4

1 に答える 1

4

PAC モデルは、ある確率で特定のレベルのエラーを取得するために必要なデータの数を単純に示します。これは、使用している実際の機械学習アルゴリズムを調べることで、実行時間への影響に変換できます。

たとえば、アルゴリズムが O(2^n) の時間で実行され、PAC モデルで .05 エラーの確率が 95% になるには 1000 個の例が必要であり、.005 エラーの場合は 10,000 個の例が必要であると示されている場合、期待する必要があることがわかります。精度の向上のための大幅な減速。一方、O(log n) アルゴリズムの同じ PAC 情報は、おそらく先に進み、より低いエラーを取得することにつながります。

余談ですが、ほとんどの教師あり学習アルゴリズムがどのように機能するかについて混乱しているようです。

学習アルゴリズムにより多くの時間 (より多くの反復など) が与えられると仮定すると、エラーとエラーが制限される確率がどのように変化するか

ほとんどの場合、パラメーター (学習率など) を変更したり、例の数を増やしたりしない限り、同じアルゴリズムに時間をかけてより良い結果を期待することはできません。おそらく「反復」とは例を意味していました。この場合、例の数が確率とエラー率に与える影響は、PAC 学習モデルに使用される連立方程式を操作することで確認できます。ウィキの記事を参照してください。

于 2011-06-29T22:33:34.603 に答える