sql - SPSS のような統計パッケージから RDBMS を作成するテーブルと列の自動定義

Question

SPSS のような統計パッケージから四角形のデータを取得するプロセスを自動化または半自動化する (つまり、有利なスタートを切る) ために使用するのに適したツールは何ですか?

データベースで読み取ることができるテキスト形式でメインの四角形データを保存する
他の参照テーブル (値ラベルなど) の追加ファイルの保存
データベースにテーブルと列を作成し、テキストファイルを関連するテーブルのデータの行としてインポートするための SQL を含むスクリプトまたはバッチファイルを起草 (おそらく手作業で仕上げる必要があります) しますか?

完全な自動化が可能かどうかは疑問ですが、これはかなり一般的なタスクに違いありません。このようなデータセットが約 12 個あり、中には数百個の変数を含むものもあり、リレーショナルデータベース (違いがある場合は Oracle) にセットアップしたいと考えています。法外なコストを除けば、手作業でこれを行うのに概念的な困難はありません。

そのようなツールが利用できるはずだと思いますが、明らかに間違った場所で検索しているか、間違った用語を使用しています。

（編集 - R タグを追加しました。これに対する私自身の回答で、ソリューションの一部として使用しているためです）

score 1 · Accepted Answer

SPSS Statistics では、出力管理システム (OMS) が任意の出力テーブルをデータセットとしてキャプチャできます。また、Statistics はデータセットをデータベースに直接書き戻すことも、CSV ファイルやその他の形式で保存することもできます。後者については、SAVE TRANSLATE を参照してください。

HTH、ジョン・ペック

score 0 · Accepted Answer

OK、さらに調査した後（そして、私が与えられた回答に感謝します。これは、完全ではありませんが役に立ちました）、私は今、次のことを好みます：

たとえば、外部パッケージを使用してRにデータを取り込む
必要な参照テーブルごとにデータフレームを作成する
as.numeric()元の要素をまたはバージョンに置き換えるとunclass()、ラベルではなく単なる数字になります
sqlSave()RODBC パッケージを使用して、メインデータと参照テーブルの両方をデータベースに保存します。

ステップ 2 は、次のような小さな関数によって容易になります。

factorToRef <- function(x, field){
    tmp <- levels(x)
    tab <- data.frame(1:length(tmp), tmp)
    names(tab) <- paste(field, c("_ID","_NAME"), sep="")
    tab
}

次のような結果が得られます

> data(iris)
> factorToRef(iris$Species, "species" )
  species_ID species_NAME
1          1       setosa
2          2   versicolor
3          3    virginica

これは、データベースに保存される参照テーブルの基礎となります。

sql - SPSS のような統計パッケージから RDBMS を作成するテーブルと列の自動定義

2 に答える 2

Related

Reference