SPSSデータセットをPython、できればNumPy再配列形式にインポートする方法はありますか?周りを見回しましたが、答えが見つかりませんでした。
ジューン
SPSSはPythonと広範囲に統合されていますが、これはSPSS(現在はIBM SPSS Statisticsとして知られています)で使用することを目的としています。PythonODBCサポートとともに使用してsavファイルを読み取ることができるSPSSODBCドライバーがあります。
オプション 1rkbarneyが指摘したように、pypiを介して利用できるPythonsavReaderWriterがあります。私は2つの問題に遭遇しました:
オプション2 私はRを仲介者として使用することを選択しました。rpy2を使用して、ファイルをRデータフレームに読み込み、CSVファイルとして再度出力してPythonにインポートする簡単な関数を設定しました。少しルーブゴールドバーグですが、機能します。もちろん、これにはRが必要です。これは、環境にインストールするのも面倒な場合があります(また、プラットフォームごとに異なるバイナリがあります)。
Pythonにspssreadへの外部呼び出しを行わせることができます。これは、SPSSファイルのコンテンツを希望どおりに出力するPerlスクリプトです。
たぶんこれは役立つでしょう:Pythonリーダー+ spss savファイル用のライター(Linux、Mac、Windows) http://code.activestate.com/recipes/577811-python-reader-writer-for-spss-sav-files-linux-マック-/
明確にするために、SPSSODBCドライバーはSPSSのインストールを必要としません。