問題タブ [statsmodels]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Hive ストリーミングを使用する Python 2.7 モジュール
Python マッパーを使用して、DSE 3.0 クラスター (Hive 0.9) で Hive ストリーミングを実行しています。私の Python スクリプトは、Python 2.7 を必要とする statsmodels モジュールをインポートします。デフォルトは 2.7 ではないため (2.4 です)、statsmodels モジュールと同様にダウンロードしてインストールします。
ただし、単純な Hive クエリを実行すると、
ここで、「docs」は行 STRING を持つ Hive テーブルです。ただし、次のエラーが表示されます。
そこで、Hive クエリを次のように変更しました。
バージョン 2.7 を呼び出します。しかし、その後、エラーが発生します
python27 と /usr/local/bin/python2.7 も試しましたが、まだ同じエラーが発生しています。誰もこれに遭遇したことがありますか?On linux SUSE or RedHat, how do I load Python 2.7の投稿に対する 2 番目の回答を既に参照しています。どんなアドバイスでも大歓迎です!
ありがとう、AM
python - 不均一な間隔の時系列の季節分解、RまたはPythonで確立されたアルゴリズム?
R の stats パッケージには stl() がありますが、ts() によって作成された等間隔の時系列が必要です。動物園のオブジェクトを扱うことはできません。
奇妙なことに、STL メソッドは LOESS で欠損値を埋めることができると主張していますが、欠損値も処理できません。(履歴書でこの質問を参照してください。)
たとえば、営業日のデータがある場合、NA を週末に設定して stl() を呼び出して、カレンダー日にすることはできません。
また、Python statsmodel の作成者が stl() を Pandas TimeSeries で動作するように移行しようとしているのを目にしますが、まだそこにはないようです。
ありがとう
編集:高調波のフィッティングのような非常に単純なモデルを実行できることを知っていることを付け加えるだけですが、少なくともベンチマークを提供するために確立されたモデルが必要です。サブマンスリー データがあるため、X12 は適用されません。
python - モデル予測の信頼区間
OLSモデルが装備されています
予測値は次の方法で提供されます。
lm.predict({'X' : [12], 'M' : [1], 'E' : [2]})
結果は、単一の値の配列として返されます。
statsmodels で予測値の信頼区間 (予測区間) も返す方法はありますか?
ありがとう。
python - Statsmodels: get_rdataset の使用方法
sm.datasets.get_rdataset を使用しようとするたびに、次のエラー メッセージが表示されます。
pip を使用してインストールした最新バージョンの statsmodels (0.5.0.dev-1bbd4ca) を使用しています。インストール ログを見ると、pip が github からソースをダウンロードしていることがわかります。
私はあなたの助けにとても感謝しています
アンディ
python - statsmodels: patsy を使用した非線形回帰モデルの指定
統計モデルを使用して非線形回帰モデルを計算しようとしています。特に、patsy 構文の学習に問題があります。
patsy 構文を使用して非線形モデルを定式化する方法のチュートリアルまたは例はありますか?
特に、この例 ( http://statsmodels.sourceforge.net/devel/examples/generated/example_ols.html )の非線形モデルは、patsy を使用してどのように指定されますか?
事前にどうもありがとうございました
アンディ
python - Python 2.7 - statsmodels - 要約出力の書式設定と書き込み
pandas 0.11.0
(データ処理)を使用してロジスティック回帰を行ってstatsmodels 0.4.3
おり、Mac OSX Lionで実際の回帰を行っています。
~2,900 の異なるロジスティック回帰モデルを実行し、結果を csv ファイルに出力し、特定の方法でフォーマットする必要があります。
現在、私はprint result.summary()
(次のように)結果をシェルに出力することだけを認識しています:
print np.exp(result.params)
によって計算され、シェルに次のように出力されるオッズ比も必要です。
私が必要とするのは、これらのそれぞれが次のような非常に長い行の形式で csv ファイルに書き込まれることです (この時点では、次のようなものが必要かどうかはわかりませんがLog-Likelihood
、完全を期すためにそれを含めました):
これらの実際の値がすべて含まれる非常に長い行と、同様の形式のすべての列指定を含むヘッダーが表示されます。
私はcsv module
Python の に精通しており、さらに に慣れてきていpandas
ます。~2,900 のロジスティック回帰モデルがすべて完了したら、この情報をフォーマットしてファイルに保存し、ファイルpandas dataframe
に書き込むことができるかどうかはわかりません。to_csv
それは確かにいいでしょう。また、各モデルが完成するごとに書いても構いません( を使用csv module
)。
アップデート:
そのため、statsmodels サイトを詳しく調べていました。具体的には、モデルの結果がクラス内にどのように格納されているかを把握しようとしていました。「Results」というクラスがあり、これを使用する必要があるようです。このクラスからの継承を使用して別のクラスを作成すると、必要なフォーマットを取得するために、メソッド/演算子の一部が変更される可能性があります。私はこれを行う方法についてほとんど経験がなく、これを理解するのにかなりの時間を費やす必要があります (これは問題ありません)。誰かが助けてくれる/経験があれば、それは素晴らしいことです!
クラスが配置されているサイトは次のとおりです: statsmodels results class
python - Python 2.7-統計モデル-result.conf_int()
この投稿は、ここにある投稿への追加です: Python 2.7 - statsmodels - format and writing summary output
信頼区間が問題を引き起こしていることを除いて、必要な方法ですべてをフォーマットしました。
私は次のようなさまざまなことを試しました:
印刷すると、次のものが返されます。
同様に、私は試しました:
しかし、エラーが発生します:
私が試しても同じこと:
また、ここ(0.4.3 を持っていて、このバージョンのページが見つかりませんでした) とここの両方で調べてみました。どちらもこの問題の解決には役立ちませんでした。
python-2.7 - 要約すると、scikits.statsmodels.api でのゼロ除算エラー
私は OLS 回帰モデルを構築しており、小さなテストを行いたいと考えていました (以下を参照)。入力データを正常に作成し、モデルに適合するように指示するとそれは実行されますが、要約を求めるとゼロ除算エラーが発生します。ここにいくつかのコードがあります(ここではランダム呼び出しの実際のデータを交換しました)
トレースバックでは、linear_model.pyc でゼロ除算が発生します。