0

SPSS のような統計パッケージから四角形のデータを取得するプロセスを自動化または半自動化する (つまり、有利なスタートを切る) ために使用するのに適したツールは何ですか?

  • データベースで読み取ることができるテキスト形式でメインの四角形データを保存する
  • 他の参照テーブル (値ラベルなど) の追加ファイルの保存
  • データベースにテーブルと列を作成し、テキスト ファイルを関連するテーブルのデータの行としてインポートするための SQL を含むスクリプトまたはバッチ ファイルを起草 (おそらく手作業で仕上げる必要があります) しますか?

完全な自動化が可能かどうかは疑問ですが、これはかなり一般的なタスクに違いありません。このようなデータセットが約 12 個あり、中には数百個の変数を含むものもあり、リレーショナル データベース (違いがある場合は Oracle) にセットアップしたいと考えています。法外なコストを除けば、手作業でこれを行うのに概念的な困難はありません。

そのようなツールが利用できるはずだと思いますが、明らかに間違った場所で検索しているか、間違った用語を使用しています。

(編集 - R タグを追加しました。これに対する私自身の回答で、ソリューションの一部として使用しているためです)

4

2 に答える 2

1

SPSS Statistics では、出力管理システム (OMS) が任意の出力テーブルをデータセットとしてキャプチャできます。また、Statistics はデータセットをデータベースに直接書き戻すことも、CSV ファイルやその他の形式で保存することもできます。後者については、SAVE TRANSLATE を参照してください。

HTH、ジョン・ペック

于 2012-08-29T21:18:47.387 に答える
0

OK、さらに調査した後(そして、私が与えられた回答に感謝します。これは、完全ではありませんが役に立ちました)、私は今、次のことを好みます:

  1. たとえば、外部パッケージを使用してRにデータを取り込む
  2. 必要な参照テーブルごとにデータ フレームを作成する
  3. as.numeric()元の要素をまたはバージョンに置き換えるとunclass()、ラベルではなく単なる数字になります
  4. sqlSave()RODBC パッケージを使用して、メイン データと参照テーブルの両方をデータベースに保存します。

ステップ 2 は、次のような小さな関数によって容易になります。

factorToRef <- function(x, field){
    tmp <- levels(x)
    tab <- data.frame(1:length(tmp), tmp)
    names(tab) <- paste(field, c("_ID","_NAME"), sep="")
    tab
}

次のような結果が得られます

> data(iris)
> factorToRef(iris$Species, "species" )
  species_ID species_NAME
1          1       setosa
2          2   versicolor
3          3    virginica

これは、データベースに保存される参照テーブルの基礎となります。

于 2012-09-09T02:38:45.510 に答える