問題タブ [statsmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
37930 参照

python-2.7 - Python のロジット回帰と特異行列エラー

ドイツのクレジット データ (www4.stat.ncsu.edu/~boos/var.select/german.credit.html) のロジット回帰を実行しようとしています。コードをテストするために、数値変数のみを使用し、次のコードを使用して結果を回帰してみました。


データを確認すると、すべての 8.0 列が独立しているように見えます。これにもかかわらず、特異行列エラーが発生しています。助けていただけますか?

ありがとう

0 投票する
2 に答える
11582 参照

python - Python (scipy、statsmodels) の t 検定が R、Stata、または Excel と異なる結果をもたらすのはなぜですか?

(問題は解決しました。x,y と s1,s2 のサイズが異なっていました)

Rで:

STATA と Excel で同じ数値が得られる

どのオプションを試しても、statsmodels.stats.weightstats.ttest_ind または scipy.stats.ttest_ind を使用して同じ結果を再現することはできません。

Python を使用して t-test を計算する人は何千人もいるはずです。私たちは皆、間違った結果を得ていますか? (私は通常 Python に依存していますが、今回は STATA で結果を確認しました)。

0 投票する
1 に答える
26202 参照

python - Pandas Dataframe AttributeError: 'DataFrame' オブジェクトに属性 'design_info' がありません

OLS 実装のpredict()機能を使用しようとしています。statsmodels.formula.apiサンプル外のデータセットの予測値を取得する関数に新しいデータ フレームを渡すとresult.predict(newdf)、次のエラーが返されます: 'DataFrame' object has no attribute 'design_info'. これは何を意味し、どうすれば修正できますか? 完全なトレースバックは次のとおりです。

編集:これは再現可能な例です。エラーは、結果オブジェクトをピクルしてからアンピクルすると発生するようです (実際のプロジェクトで行う必要があります)。

0 投票する
1 に答える
2459 参照

python - Statsmodels の警告を例外に変える方法

Python とパンダの初心者です。統計モデルを使用してロジスティック回帰を当てはめ、有権者が投票する確率を計算しようとしています。私は地区レベルで働いています。そのため、関数が収束しない場合があり、次のエラーが表示されます: 警告: 最大反復回数を超えました。

私はすでに反復の最大数を 1000 に増やしました。次に、その「警告」を例外に変えようとしました。警告をインポートし、 warnings.simplefilter('error', Warning) を含めてキャプチャしようとしましたが、真の Python 警告ではないようです。むしろ、反復の最大数に達したときに statsmodels が出力するものです。

だから今、私は言う方法があるかどうか疑問に思っています:

0 投票する
0 に答える
1565 参照

python - scipy.stats.gaussian_kde の代わりに statsmodels.nonparametric.kde を使用する

scipy.stats.gaussian_kdestatsmodels.nonparametric.kdeの代わりにモジュールを使用すると、速度が大幅に向上する可能性があることを読みました。

現在計算している単純なコード ブロック (4 行のコード) があり、実際に速度が向上するかどうかを確認するscipy.stats.gaussian_kdeために、それらを同等のものに置き換えたいと考えています。statsmodels

これは MWE です。

ご覧のとおり、置き換える必要があるのはわずか 4 行のコードです。残念ながら、 のドキュメントstatsmodels.nonparametric.kdeはやや貧弱で、そのような置換を行う方法がわかりません。

最後の行は、ほとんどの計算時間がここで費やされるため、最も重要な行です (ここで説明されているように、カーネル推定のサンプリングを高速化します)。

0 投票する
2 に答える
9321 参照

python - 複数の回帰パラメーターの Statsmodels OLS 関数

次のような方程式のアルファ(a)値を見つけたいとしましょう

OLS を使用すると、i=2 の基本的なケースで 10 個の値から開始するとします。

statsmodel を使用して、一般的に次のコードを実行して、nx1 x および y 配列のルートを取得します。

ただし、x が y と等しくない場合、これは機能しません。OLS がわからない場合は、方程式が最初のページにあります。

0 投票する
1 に答える
11853 参照

python - Pandas 回帰からプロットする回帰直線を取得する

(pandas)pd.ols と (statsmodels)sm.ols の両方を使用して、回帰直線を使用して回帰散布図を取得しようとしましたが、散布図を取得できますが、取得するためのパラメーターを取得できないようですプロットする回帰直線。ここでカットアンドペーストコーディングを行っていることはおそらく明らかです:-((これをガイドとして使用: http://nbviewer.ipython.org/github/weecology/progbio/blob/master/ipynbs/statistics.ipynb

私のデータは pandas DataFrame にあり、x 列は merged2[:-1].lastqu で、y データ列は merged2[:-1].Units です。コードは次のようになりました: 回帰を取得するには:

^^^^大丈夫そうです

^^^^^これで散布図が完成します****そして以下では回帰直線が得られません

データフレームのスニペット: [:-1] は、現在の期間をデータから削除します。これは、後で投影されます

編集:

私ができることがわかりました:

ここで説明されているようにStatsmodels doc は、私が望んでいた主なもの (およびそれ以上) を取得しているようですが、以前のコードでどこが間違っていたのかを知りたいです!