問題タブ [data-fitting]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
479 参照

matlab - 適合度 - シミュレートされた方程式曲線を使用したいくつかのデータ ポイントの比較

シグモイド曲線を当てはめたい参照データ ポイントのセットがあります。MATLAB のカーブ フィッティング ツールを使用してこれを行うことができますが、データに適合させるためのカスタム方程式があります。方程式には 4 ~ 5 個の変数があり、それらを変化させて適合度をテストします。

goodnessOfFitこの機能を使ってみました。ただし、テスト データと参照データの行列が同じサイズである必要があります。私が持っている参照データ ポイントの数は少なく (15 ~ 20)、カスタム式を使用して生成されたテスト ポイントの数は多くなります。

曲線の適合度を確認できる他の方法はありますか? または、参照データのポイントに対応するテスト データ ポイントを見つけてからgoodnessOfFit関数を使用する必要がありますか (このアプローチの問題の 1 つは、テスト データと参照データの x 軸の解像度が同じでないことです。 a x-point 1.2368 in ref. data テスト データに 1.23 と 1.24 があります.データを四捨五入してフィットを計算する必要があります)。

0 投票する
0 に答える
322 参照

python - SciPy curve_fit がデータに完全に適合していませんか?

Scipy.optimize curve_fit 関数を使用して、共鳴チャンバー内の音響モードのデータに線を当てはめようとしましたが、結果は期待どおりではありません。関数はエラーなしで値を返しますが、結果をデータに対してプロットすると、適合が非常に悪くなります。これは、データの不足/不十分なデータ/ローレンツがデータ内で重複していることが原因である可能性がありますか、それとも何か間違っていますか?

私が当てはめようとしているデータは、周波数が隣り合う音響モードの 2 つであり、データはローレンツに適合する必要があるため、2 つのローレンツの和のモデル関数を定義しました。

コードは次のとおりです。

0 投票する
1 に答える
1094 参照

r - 共通のデータセットに対するこれら 2 つのフィッティング方法 (R ロジスティック回帰とベータ回帰) で標準誤差が異なるのはなぜですか?

有界応答変数を持つデータセットの 2 つの異なるフィッティング方法の違いを理解しようとしています。応答変数は分数であるため、範囲は [0,1] です。これは一般的な操作であるため、Google の検索でさまざまな方法があることがわかりました。私は現在、ストック R GLM フィットと betareg パッケージで提供されるベータ回帰の違いに興味があります。「betareg」パッケージの GasolineYield データ セットをサンプル データ セットとして使用しています。コードと結果を投稿する前に、私の 2 つの質問は次のとおりです。

  1. 組み込みの R GLM を正しく使用して、R でロジスティック回帰適合を実行していますか?

  2. ベータ回帰で報告された標準誤差が、R ロジスティック回帰の標準誤差よりもはるかに小さいのはなぜですか?

R セットアップ コード

「betareg」パッケージのベータ回帰コード

ベータ回帰の要約出力

R ストック R からの GLM ロジスティック回帰コード

R GLM ロジスティック回帰の要約出力

0 投票する
4 に答える
8050 参照

gnuplot - gnuplot で対数データを合わせる

ここに画像の説明を入力適合がデータにとってあまり良くないことがわかるので、このプロットに適合させようとします。

私のコードは次のとおりです。

問題は、ここでどのように計算するかです。対数平面では、コードに入力した形式の適合は、データを非常にうまく表現する必要があると思うからです。

どうもありがとう

最後に、Christop の回答の提案を使用して問題を解決し、少し変更することができます。

関数のおおよその傾き (-4 に近い値) を見つけた後、このパラメーターを修正して、a だけで曲線をフィットさせ、それを修正して b だけを変更しました。その後、出力をフィットの開始ソリューションとして使用して、最適なフィットを見つけました。 ここに画像の説明を入力

0 投票する
1 に答える
1922 参照

python - numpy を使用してデータを sinc 関数に適合させる最も簡単で適切な方法は何ですか?

私はいくつかの作業を行い、最終的にその形状がsinc関数のように見えるデータを取得し、numpyを使用してグラフをsinc関数に適合させる方法を検索しようとしましたが、これが見つかりました:

Pythonで変数Sinc関数を適合させる

見つかったのは良いことですが、なぜそれが非常に複雑に見えるのでしょうか。

sinc関数のような曲線を与えるグラフをフィッティングするためのよりフレンドリーな方法を教えてください。

0 投票する
1 に答える
74 参照

outliers - 角度データをフィッティングするための戦略

私は角度のセットを持っています。分布は大まかに次のように説明できます。

  • 通常、正しい解に非常に近い (0.0 ~ 1.0 度離れた) いくつかの値があります。
  • 反対方向であっても、正しい結果とはかけ離れたノイズの多い値もあります。

そのような問題に対する一般的な解決策/戦略はありますか?

多次元データの場合は RANSAC を使用しますが、1 次元データに Ransac を適用するのは珍しいという印象があります。別の問題は、角度の平均を計算することです。ベクトルを使用して角度の平均を計算する方法に関する他の投稿を読みましたが、両方の問題を既に処理する特定のフィッティング ソリューションがないのではないかと思います。

0 投票する
0 に答える
343 参照

distribution - fitdistrplus パッケージの fitdist 関数の「開始」引数のパラメーターの初期値を知るにはどうすればよいですか?

データへの当てはめ分布を学習しています。fitdistrplus パッケージの fitdist 関数を使用していますが、カイ二乗分布の場合は、パラメーターの初期値を含む名前付きリストを指定する必要があります...

[1] 0.6666667 1.3666667 1.2833333 1.3666667 1.5833333 1.5333333 0.6666667 [8] 3.5333333 1.4166667 2.4500000 0.3333333 0.7666667 1.6000000 0.3833333 [15] 0.2666667 >1.8000000 3.2166667 1.3166667 2.4333333 2.2833333 2.3166667 [22] 4.1000000 1.0500000 0.3500000 >1.3166667 2.8333333 0.3166667 1.8333333 [29] 1.4666667 1.9833333 3.3666667 1.7000000 2.0666667 >1.4333333 0.5666667

エラー en fitdistr(surface.na.omit, "chi-squared"): 'start' は名前付きリストでなければなりません

start は名前付き分布のパラメータの初期値を与える名前付きリストです。この引数は、妥当な開始値が計算される一部の分布では省略される場合があり (詳細を参照)、パラメーターの推定に閉じた式が使用される場合は考慮されません。

しかし、この値を計算または見つける方法がわかりません...誰かが私にこれを説明できますか? :/ どうもありがとうございます...

エアリー