問題タブ [function-approximation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - 誤差が最大で 10^-3 のテイラー級数
のテイラー級数を計算しようとしていますがcos(x)
、エラーはせいぜい10^-3
でありx ∈ [-pi/4, pi/4]
、エラーは 未満である必要があります0.001
。for ループの x += を変更して、異なる結果を得ることができます。数値をいくつか試してみましたが、0.001 未満のエラーにはなりません。
私もそのためにやっていe^x
ます。この部分については、x must in [-2,2]
.
しかし、for ループの項の数を変更すると、常に 1 より大きい誤差が発生し10^-3
ます。
ありがとう!
python - SCIPY - 単変量スプライン近似
scipy でノイズの多いデータの近似を作成しようとしていますが、この特定の関数では機能しないようです。平滑化係数「s」を適用しても何も変わりません。近似ではなく補間で終わります。奇妙なことに、通常は同じタイプの関数 (x^-2) を近似します。どのように変更できますか?
algorithm - 線形関数近似による Q 学習
関数近似で Q 学習アルゴリズムを使用する方法について、いくつかの役立つ指示を取得したいと思います。基本的な Q 学習アルゴリズムについては、例を見つけましたが、理解できたと思います。関数近似を使用する場合、問題が発生します。誰かがそれがどのように機能するかの短い例を通して説明してもらえますか?
私が知っていること:
- Q 値にマトリックスを使用する代わりに、機能とパラメーターを使用します。
- フィーチャとパラメータの線形結合で近似を行います。
- パラメータを更新します。
私はこの論文をチェックしました:関数近似によるQ学習
しかし、それを使用するための有用なチュートリアルが見つかりません。
手伝ってくれてありがとう!
machine-learning - 線形関数近似を使用した q 学習の機能を選択するにはどうすればよいですか
強化学習を用いたAIの開発を行っています。
空から落ちてくるレンガを避けるゲームです。
20 個のレンガが地面に落ちています。 ゲームのスクリーンショット、ゲームプレイ動画リンク
線形関数による強化学習を用いて AI を実装しました。
満足のいく結果を得るために最適な機能を選択するのは困難でした。
とにかく、作ってみて以来、最高のスコアを獲得することができました。
しかし、それはかなり奇妙です。
いくつかの理由があります。
- 10 トレーニング前後で非常に早く収束に達しました。
- 6つの機能を使用しました。
- 何度もトレーニングを重ねても良いスコアは出せませんでした。(自分の AI をスーパー プレイヤーのようにプレイさせたかったのですが、そうは見えませんでした。)
その間、私は多くの機能を使用しようとしました。機能をゲーム画面サイズ (960 * 640) として定義しました。
そして、プレイヤーからのブリックの相対座標であるこれらの機能を埋めます。前回よりも良い結果が出せることを願っています。このメソッドを 7 時間トレーニングしましたが、うまくいきませんでした。
肝心なのは、機能を最適に機能させるにはどのように選択すればよいですか、またはそれを解決するための別のアプローチはありますか?
r - rの線形補間による値の検索
標準の高さでいくつかの変数の値を見つけるために必要な膨大なデータがあります。で他の変数の値を線形補間Height=c(0,100,200,250,400,500)
し、既存のデータに新しい列として追加したいと考えています。これは、標準として1つの変数の値を取得しようとしたものですHeight=c(0,100,200,250,400,500)
。これは 1 つの変数のみです。
data2<-approx(data2$Height,data2$ozone,xout=c(0,100,200,250,400,500))
期待される結果は、18 行 4 列のデータ フレームです。
サンプルデータは次の(data2)
とおりです。
よろしくお願いいたします。
アップデート
望ましい答えは次のとおりです。