26

Python の統計パッケージの選択についてアドバイスが必要です。かなりの検索を行いましたが、特に statsmodels と scipy.stats の違いについて、すべてが正しいかどうかわかりません。

私が知っていることの 1 つは、scikits 名前空間を持つものは scipy の特定の「ブランチ」であり、以前は scikits.statsmodels だったものは現在 statsmodels と呼ばれています。一方、scipy.stats もあります。2 つの違いは何ですか? Pythonの統計パッケージはどちらですか?

ありがとう。

- 編集 -

一部の回答が質問に実際には関係していないため、タイトルを変更しました。これは、タイトルが十分に明確でないためだと思います。

4

3 に答える 3

38

Statsmodels には依存関係として scipy.stats があります。Scipy.stats には、すべての確率分布といくつかの統計検定が含まれています。これは、numpy と scipy の流れを汲むライブラリ コードに似ています。一方、Statsmodels は、R に似た数式フレームワークを使用して統計モデルを提供し、pandas DataFrames で動作します。statsmodels には、統計テスト、プロット、および多くのヘルパー関数もあります。本当に必要なものによって異なりますが、どれかを選択する必要はありません。彼らは異なる目的と強みを持っています。

于 2013-01-29T03:34:59.237 に答える
4

私は日常的に pandas/statsmodels/scipy を仕事に使用しようとしていますが、それらのパッケージが少し不足することがあります (LOESS、誰か?)。RPy モジュールの問題は、(少なくとも最後に確認したところ) 最新ではない特定のバージョンの R が必要なことです。私の R インストールは 2.16 (だと思います) で、RPy は 2.14 を望んでいました。したがって、R を 2 つ並行してインストールするか、ダウングレードする必要があります。(R がインストールされていない場合は、正しいバージョンの R をインストールして RPy を使用できます。)

そのため、pandas/statsmodels/scipy にないものが必要な場合は、R スクリプトを作成し、subprocessモジュールで実行します。これにより、R とのやり取りを可能な限り少なくすることができます (プログラミングはあまり好きではありません) が、Python パッケージにはない R の機能をすべて活用できます。

教訓は、どんな問題にも1 つの解決策というものは決してないということです。問題解決。(もちろん、R 愛好家は反対するでしょう!)

于 2013-01-29T04:29:59.933 に答える
-1

THE 統計パッケージは numpy/scipy だと思います。matplotlib を使用してデータをプロットする場合にも最適です。ただし、私の知る限り、matplotlib は Python 3.x ではまだ動作しません。

于 2013-01-29T01:13:26.357 に答える