問題タブ [statsmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - Python のロジット回帰と特異行列エラー
ドイツのクレジット データ (www4.stat.ncsu.edu/~boos/var.select/german.credit.html) のロジット回帰を実行しようとしています。コードをテストするために、数値変数のみを使用し、次のコードを使用して結果を回帰してみました。
データを確認すると、すべての 8.0 列が独立しているように見えます。これにもかかわらず、特異行列エラーが発生しています。助けていただけますか?
ありがとう
python - Python (scipy、statsmodels) の t 検定が R、Stata、または Excel と異なる結果をもたらすのはなぜですか?
(問題は解決しました。x,y と s1,s2 のサイズが異なっていました)
Rで:
STATA と Excel で同じ数値が得られる
どのオプションを試しても、statsmodels.stats.weightstats.ttest_ind または scipy.stats.ttest_ind を使用して同じ結果を再現することはできません。
Python を使用して t-test を計算する人は何千人もいるはずです。私たちは皆、間違った結果を得ていますか? (私は通常 Python に依存していますが、今回は STATA で結果を確認しました)。
python - Pandas Dataframe AttributeError: 'DataFrame' オブジェクトに属性 'design_info' がありません
OLS 実装のpredict()
機能を使用しようとしています。statsmodels.formula.api
サンプル外のデータセットの予測値を取得する関数に新しいデータ フレームを渡すとresult.predict(newdf)
、次のエラーが返されます: 'DataFrame' object has no attribute 'design_info'
. これは何を意味し、どうすれば修正できますか? 完全なトレースバックは次のとおりです。
編集:これは再現可能な例です。エラーは、結果オブジェクトをピクルしてからアンピクルすると発生するようです (実際のプロジェクトで行う必要があります)。
python - Statsmodels の警告を例外に変える方法
Python とパンダの初心者です。統計モデルを使用してロジスティック回帰を当てはめ、有権者が投票する確率を計算しようとしています。私は地区レベルで働いています。そのため、関数が収束しない場合があり、次のエラーが表示されます: 警告: 最大反復回数を超えました。
私はすでに反復の最大数を 1000 に増やしました。次に、その「警告」を例外に変えようとしました。警告をインポートし、 warnings.simplefilter('error', Warning) を含めてキャプチャしようとしましたが、真の Python 警告ではないようです。むしろ、反復の最大数に達したときに statsmodels が出力するものです。
だから今、私は言う方法があるかどうか疑問に思っています:
python - scipy.stats.gaussian_kde の代わりに statsmodels.nonparametric.kde を使用する
scipy.stats.gaussian_kdestatsmodels.nonparametric.kde
の代わりにモジュールを使用すると、速度が大幅に向上する可能性があることを読みました。
現在計算している単純なコード ブロック (4 行のコード) があり、実際に速度が向上するかどうかを確認するscipy.stats.gaussian_kde
ために、それらを同等のものに置き換えたいと考えています。statsmodels
これは MWE です。
ご覧のとおり、置き換える必要があるのはわずか 4 行のコードです。残念ながら、 のドキュメントstatsmodels.nonparametric.kde
はやや貧弱で、そのような置換を行う方法がわかりません。
最後の行は、ほとんどの計算時間がここで費やされるため、最も重要な行です (ここで説明されているように、カーネル推定のサンプリングを高速化します)。
python - 複数の回帰パラメーターの Statsmodels OLS 関数
次のような方程式のアルファ(a)値を見つけたいとしましょう
OLS を使用すると、i=2 の基本的なケースで 10 個の値から開始するとします。
statsmodel を使用して、一般的に次のコードを実行して、nx1 x および y 配列のルートを取得します。
ただし、x が y と等しくない場合、これは機能しません。OLS がわからない場合は、方程式が最初のページにあります。
python - Pandas 回帰からプロットする回帰直線を取得する
(pandas)pd.ols と (statsmodels)sm.ols の両方を使用して、回帰直線を使用して回帰散布図を取得しようとしましたが、散布図を取得できますが、取得するためのパラメーターを取得できないようですプロットする回帰直線。ここでカットアンドペーストコーディングを行っていることはおそらく明らかです:-((これをガイドとして使用: http://nbviewer.ipython.org/github/weecology/progbio/blob/master/ipynbs/statistics.ipynb
私のデータは pandas DataFrame にあり、x 列は merged2[:-1].lastqu で、y データ列は merged2[:-1].Units です。コードは次のようになりました: 回帰を取得するには:
^^^^大丈夫そうです
^^^^^これで散布図が完成します****そして以下では回帰直線が得られません
データフレームのスニペット: [:-1] は、現在の期間をデータから削除します。これは、後で投影されます
編集:
私ができることがわかりました:
ここで説明されているようにStatsmodels doc は、私が望んでいた主なもの (およびそれ以上) を取得しているようですが、以前のコードでどこが間違っていたのかを知りたいです!