問題タブ [statsmodels]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
7961 参照

python - Pythonでロジスティック回帰を計算する

論理回帰を計算してみました。私はcsvファイルとしてデータを持っています。のように見える

これは私のコーディングです。

Python でコーディングを実行すると、エラーが発生しました。

コードを書き直すには?

0 投票する
1 に答える
377 参照

rabbitmq - Celery、RabbitMQ、statsmodels で永久に保留中のタスク

Celery と RabbitMQ を使用して、いくつかの線形回帰タスクを分散しようとしています。セットアップは add(x,y) 関数の例で問題なく動作しますが、statsmodels OLS クラスをインスタンス化すると、たとえば

100% の CPU を消費している間、ワーカーは無期限に保留されます。

何が起こっている?

0 投票する
6 に答える
72146 参照

python - StatsModels による信頼区間と予測区間

私はこれlinear regressionを行いStatsModelsます:

私の質問は、上限iv_liv_u下限の信頼区間または予測区間ですか?

他のユーザーを取得するにはどうすればよいですか?

プロットを行うには、すべてのポイントの信頼区間と予測区間が必要です。

0 投票する
1 に答える
1624 参照

python - statsmodel ARMA 関数は Pandas と互換性がありませんか?

30 秒間隔のレコードを含むデータ セットを取得しました。時系列モジュールの ARMA 関数を使用して予測予測を実行しようとしています。データのプライバシーのため、ランダム データを使用してエラーを再現しました

私のパッケージのバージョン:
Python バージョン 2.7.3 pandas バージョン
0.11.0
statsmodels バージョン 0.5.0

主なエラーメッセージは次のとおりです(一部省略)。

ARMA は pandas によって生成された日付形式をサポートしていないようです。date_range の freq オプションを削除すると、年が pandas の制限をはるかに超えるため、このコマンドは大きなシリーズでは機能しません。

とにかく移動するには?ありがとう

更新: data_series.values を使用しても問題ありませんが、次は予測を行う方法を教えてください。私のdata_indexは[2013-05-26 00:00:00、...、2013-06-29 17:19:30]からのものです

それでもエラーが発生する

predict = model.predict() を通過してシーケンス全体の予測を生成できることはわかっていますが、一致させることはできますが、全体的にはそれほど便利ではありません。

0 投票する
1 に答える
1838 参照

python - Python Pandas の加重最小二乗による予期しない標準誤差

Python Pandas のメイン OLS クラスのコードで、重み付けされた OLS が実行されたときに報告される標準誤差と t-stats に使用される規則を明確にするための助けを探しています。

Pandas を使用し、scikits.statsmodels WLS を直接使用するためのインポートを含む、サンプル データ セットを次に示します。

これを%cpasteIPython で実行してから、両方の回帰の要約を出力します。

標準誤差の不一致に注意してください。Pandas は、標準誤差はあると主張していますが[0.9079, 1.0191]、statsmodels は次のように言っています。[0.295, 0.333].

投稿の上部にリンクしたコードに戻り、不一致の原因を追跡しようとしました。

まず、標準誤差が次の関数によってレポートされていることがわかります。

だからself._var_beta_raw私は見つけます:

私の使用例でself._nw_lagsは、None常にそうであるため、不可解なのは最初の部分です。xxはリグレッサー行列の標準積にすぎないため、x.T.dot(x)重みがこれにどのように影響するのか疑問に思っています。この用語self._rmse_rawは、 のコンストラクターに適合する statsmodels 回帰から直接得OLSられるため、最も確実に重みが組み込まれます。

これにより、次の質問が表示されます。

  1. RMSE 部分に適用された重みで標準誤差が報告されるのに、リグレッサー変数には報告されないのはなぜですか。
  2. 「変換されていない」変数が必要な場合、これは標準的な方法ですか (変換されていない RMSE も必要ではないでしょうか??) Pandas に完全に重み付けされたバージョンの標準エラーを返させる方法はありますか?
  3. なぜすべての誤指示なのですか?コンストラクターでは、完全な statsmodels 適合回帰が計算されます。絶対にすべての要約統計量がそこから直接得られないのはなぜですか? 一部が statsmodels 出力から取得され、一部が Pandas の家庭で調理された計算から取得されるように、混合して一致させるのはなぜですか?

次のようにして、パンダの出力を調整できるようです。

私はこの関係に非常に混乱しています。これは統計学者の間で一般的なことでしょうか: 重みを RMSE 部分に含めますが、係数の標準誤差を計算するときに変数に重みを付けるかどうかを選択しますか? その場合、Pandas と statsmodels の間で係数自体も異なるのではないでしょうか? これらは statsmodels によって最初に変換された変数から同様に導出されるためです。

参考までに、おもちゃの例で使用した完全なデータ セットを次に示します (np.random.seed再現可能にするのに十分でない場合)。