グーグルでさまざまな結果を見つけています。SPSS .sav ファイルを解析して、データ レイアウトを検出し、調査結果を抽出する必要があります。ステップ 1 は、データの「スキーマ」を読み取ることです。たとえば、質問とその許可された応答の種類を知る必要があります。このデータを独自の SQL テーブルでモデル化して、アプリの要件に合わせて細分化できるようにする予定です。ステップ 2 は、回答者の回答をデータ モデルに入力することです。SPSS sav ファイルを見ると、探している両方のタイプのデータが含まれていると思います。
厳密に必要でなければ、高価な SPSS ソフトウェアは必要ありません。このデータの統計は行いません。回答フィルターに基づいて回答者のサブセットを選択するだけです。SPSS ファイルは、SPSS のライセンスを供与するパートナー企業から提供されます。データを SPSS に戻す必要はありません。私のユースケースは読み取り専用です。
パーサー プログラムには、Groovy の有無にかかわらず Python、Java、C/C++ を使用できます。このプログラムはデータ収集の最後に 1 回実行されるため、パフォーマンスは特に重要ではありません。理想的には、自分のコードをクロス プラットフォームにして、Mac で開発し、Linux に展開できるようにしたいのですが、必要に応じて Windows を使用することもできます。
見つかっているものの多くは、2004 年の Java クラスか、IBM の DLL を必要とし、Windows 固有の最新の Python コードです。要件の簡単な説明に基づいて、SO コミュニティからの推奨事項をいただければ幸いです。私のニーズは単純だと思いますが、私が望んでいたものを正確には見つけられませんでした. オープンソースのライブラリが理想的ですが、単純な商用ソリューションを手頃な価格で購入することさえできます。