問題タブ [model-fitting]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - ガンマ分布の当てはめグラフと実際のグラフを1つのプロットに描く方法は?
ステップ1。必要なパッケージをロードします。
ステップ2。ガンマ分布に適合する 10,000 個の数値を生成します。
Step.3. x
どの分布に適合するかわからない場合、pdf(確率密度関数)を描画します。
Step.4. グラフから、 の分布がx
ガンマ分布に非常に似ていることがわかるため、 fitdistr()
in パッケージを使用しておよびガンマ分布MASS
のパラメーターを取得します。shape
rate
Step.5. 実際の点(黒点)と当てはめグラフ(赤線)を同じプロットに描いてください。ここに問題があります。最初にプロットを見てください。
質問 1: 実際のパラメーターは、、、shape=2
関数rate=0.2
を使用しfitdistr()
て取得するパラメーターはshape=2.01
、、rate=0.20
です。この2つはほぼ同じですが、なぜ当てはめグラフが実際の点にうまく当てはまらないのか、当てはめグラフに何か問題があるに違いないか、当てはめグラフと実際の点の描き方がまったく間違っています。 ?
質問 2: 確立したモデルのパラメーターを取得した後、どの方法でモデルを評価しますか?RSS(residual square sum)
線形モデルのようなもの、または のp-value
、shapiro.test()
およびks.test()
その他のテスト? 私は統計の知識が乏しいので、両方の質問から私を助けてください、ありがとう!(ps: 私は Google とスタックオーバーフローで何度も検索していますが、うまくいかないので、この質問は役に立たないので投票しないでください,Thx! )
r - 非常に高い残差二乗和
フィッティングの剰余平方和に問題があります。剰余の二乗和が高すぎます。これは、適合があまりよくないことを示しています。しかし、視覚的には、この非常に高い残余価値を持つことは問題ないように見えます...何が起こっているのかを知るのを手伝ってくれる人はいますか?
私のデータ:
次に、nlsLM 関数 (minpack.lm パッケージ) を使用して適合させます。
この値は剰余です。
平方和残差が高すぎます: 12641435 ...
そうですか、それとも調整がおかしいのでしょうか。悪いですか?
python - Pandas DataFrame を Scipy.optimize.curve_fit に渡します
Scipy を使用して Pandas DataFrame 列に適合させる最良の方法を知りたいです。A
Z が A、B、C、および D に依存する列 ( 、B
、C
、D
および)を持つデータ テーブル (Pandas DataFrame) がある場合Z_real
、Z ( Z_pred
)。
適合する各関数のシグネチャは
series は、DataFrame の各行に対応する Pandas シリーズです。さまざまな関数がさまざまな列の組み合わせを使用できるように、Pandas シリーズを使用します。
DataFrame をscipy.optimize.curve_fit
使用して渡そうとしました
しかし、何らかの理由で、各 func インスタンスには、各行の Series ではなく、データテーブル全体が最初の引数として渡されます。また、DataFrame を Series オブジェクトのリストに変換しようとしましたが、これにより関数に Numpy 配列が渡されます (Scipy が Series のリストから Pandas を保持しない Numpy 配列への変換を実行するためだと思います)。シリーズ オブジェクト)。
3d - 平面セグメンテーションと平面フィッティングの違い
私は最近、3Dメッシュで壁、床、天井を検出する必要があるプロジェクトに取り組んでいます。いくつかの調査を行った後、RANSAC アルゴリズムを使用して床と壁の一部を検出することができました。どちらも床を含む点群になるように見えるため、平面フィッティングと平面セグメンテーションの違いを誰かが説明できるかどうか疑問に思っていましたか?
r - R: 「実際と適合」のプロット
時系列の実際のデータと適合モデルの値のプロットに関連する質問があります。特に、私の質問はこの論文に関連しています。
ドキュメントの付録に、R スクリプトがあります。ここで、最初に 2 つの質問があります。
do との機能は何ですか:
最後の主な質問: データを次のように計算するとします。
adj。R 二乗値は 0.342 です。したがって、上記のモデルは、モデル化されたデータ (予測データ?) と実際のデータの間の分散の約 34% を説明していると私は主張します。では、この「モデル グラフ」(フィッティング) をどのようにプロットして、論文にこのようなものを表示できますか?
2番目のグラフの「適合」は、実際には推定モデルからのデータであると思いますよね? もしそうなら、この部分はスクリプトに欠けているようです。
どうもありがとう!
編集1:
これを試しました:
出力: (関数 (式、データ = NULL、サブセット = NULL、na.action = na.fail、: 変数の長さが異なります (「月」が見つかりました) のエラー)
r - fitdistrplus によるガンベル分布のあてはめ
この回答からコードを再現しようとしていますが、そうするのに問題があります。パッケージVGAM
とfitdistrplus
. 次の場合に問題が発生します。
location
とscale
が *gumbel の引数ではないかのように。
dgumbel
、pgumbel
、rgumbel
およびqgumbel
は によって正しく提供されVGAM
ます。gumbel
ただし、このパッケージには、構文が異なるという関数も用意されています。これは問題を引き起こしている可能性がありますか?
編集:はい、確かに問題を引き起こしています:FAdist
代わりにパッケージを使用すると、完全に正常に動作します。
r - Rのデータフレームで機能しないデータをきれいにするための線形回帰
一部の NA を特定の値に割り当てた後、データ フレームのクリーニングに問題があります。まず、NA が含まれていない credit_clean という data.frame があります。このように見えます。
次に、df のさまざまな列で、外れ値に NA を割り当てます。
NA 値を削除して、credit_cl という名前の新しい df を作成しました。新しい df には 120005 の観測があり、NA はありません。
ここで問題が発生します。線形回帰を使用して適合および予測しようとすると、何も実行されず、エラーも表示されません。ライブラリ(woe)からiv.mult()と呼ばれる情報値関数を使用しようとすると、この問題も発生します。
そのときRは何もしないので、データフレームは私が使用した他のdfと同じように見えるので、間違いが起こっているかどうかはわかりません。
R バージョン 3.1.3 (2015-03-09) を使用しています -- RStudio バージョン 0.99.891 の「Smooth Sidewalk」