2

私は、SPSS を使用して以前の結果がどのように収集されたかを解明する任務を負っている開発者であるため、新しいデータを使用してプロセスを繰り返すことができます。元の分析を行った人物に尋ねることはできません。悲しいことに、彼はもう私たちと一緒にいないためです。

私は統計学者ではないので、関係する原則を理解する必要はありません。ナビゲートするメニュー項目を知る必要があるだけです。

10,000 人に多くの質問をするアンケートを実施しました。これらの質問の 15 のサブセットが分析に使用されています。

データを 4 セットに減らすために因子分析が行われたことはわかっています。次に、K-means クラスタリングを使用してクラスターの中心を見つけました。これは私が今求めているものです。

因子分析を実行して、データベースにあるデータと一致するコンポーネント スコア係数マトリックスを取得する方法を考え出しました。これは、[分析] > [次元削減] > [係数] に移動して行いました。次に、「抽出」セクションから一定数の因子 (4) を選択し、「回転」セクションから「バリマックス」回転を選択し、「スコア」セクションの「因子スコア係数行列の表示」をチェックしました。

これにより、次のようなデータが得られました。

マトリックス 値 1 値 2 値 3 値 4 
Q1        -0.0756 0.2134 -0.0245 -0.1236
 Q2        ... ... ... ...
 Q3        ... ... ... ...
...

私が知らないのは、k-means クラスタリングを行うためにこれをどのように進めるかということです。

データベースにある結果は次のようになります。

クラスターの中心 値 1 値 2 値 3 値 4 値 5 
FAC1_1             -0.8373 -0.5766 0.2100 1.3499 0.2940
 FAC2_1             ... ... ... ... ...
 FAC3_1             ... ... ... ... . ..
 FAC4_1             ... ... ... ... ...

ここで、[分析] > [分類] > [K-means クラスター] を使用して元のデータ セットに対して k-means クラスタリングを実行できることは知っていますが、実行した因子分析を参照する方法がわかりません。

SPSS を使用してこれらのクラスター センターを作成する方法について、誰かが私に洞察を与えることができますか?

4

4 に答える 4

4

FACTOR 分析の GUI ([分析] > [次元削減] > [因子]) には、サブダイアログ [スコア] があり、[変数として保存] がチェックされていることを確認してください。

これにより、因子スコアがデータ、つまり変数 FAC1_1、FAC2_1、FAC3_1、FAC4_1 に保存されます。

K-means GUI で入力変数として追加する必要があるのは、これらの変数です。

構文で作業をセットアップする方が良いので、他の誰かがあなたの作業を複製したい場合は、そうすることができます (理想的には、あなたの前任者も構文ドキュメントにパンくずを残しておく必要があります。私はこれを見つけるためにあらゆる試みを行います)存在する可能性がわずかにある場合は、.sps ファイル拡張子のファイルを記録します)。

これを構文で設定する方法と、その動作がどのように見えるかを次に示します。

/* Replicate the factor analysis (four factors) and save the factor score variables */.
FACTOR
  /VARIABLES < INPUT THE 15 VARIABLES HERE >
  /MISSING LISTWISE 
  /ANALYSIS < INPUT THE 15 VARIABLES HERE >
  /PRINT EXTRACTION ROTATION FSCORE
  /FORMAT SORT BLANK(.10)
  /PLOT ROTATION
  /CRITERIA FACTORS(4) ITERATE(25)
  /EXTRACTION PC
  /CRITERIA ITERATE(25)
  /ROTATION VARIMAX
  /SAVE REG(ALL)
  /METHOD=CORRELATION.

 /* Replicate the clustering using factor scores as inputs, generating 5 segments */.
QUICK CLUSTER FAC1_1 FAC2_1 FAC3_1 FAC4_1
  /MISSING=LISTWISE
  /CRITERIA=CLUSTER(5) MXITER(10) CONVERGE(0)
  /METHOD=KMEANS(NOUPDATE)
  /SAVE CLUSTER (Seg5)
  /PRINT INITIAL.

/* Check centroids match*/.
MEANS FAC1_1 FAC2_1 FAC3_1 FAC4_1 BY Seg5 /CELLS MEAN.

FACTORスコア変数を複製して正確に一致させることができれば、それは良いスタートです。重心が一致しない場合、因子スコアが一致することを考えると、セグメントの割り当てが現在違う。ケースの順序が以前と異なる場合、同じ入力/方法論を使用しているにもかかわらず、K-Means QUICK CLUSTER は、ランダムな開始点により、異なるセグメント割り当てを生成する可能性があり、生成する可能性が最も高くなります。

これを回避する方法はわかりませんが、原則として、これらは彼/彼女が取った可能性のある手順です.

于 2015-05-21T10:33:09.933 に答える
1

私は自分のプロジェクトに対して同じ種類の分析を行いました。最初に因子分析を実行します。因子分析から適切な量の分散を抽出できたら、因子スコアを保存してみてください (SPSS で)。

因子スコアを保存するには、[分析] -> [次元削減] -> [因子] -> [スコア] -> [変数として保存] に移動します。

スコアを保存すると、コンポーネントの数に基づいて変数ビューに新しい変数が作成されます。

因子のスコアを保存できたら、[分析] -> [分類] -> [K-Means] に移動し、新しい変数 (因子スコア) を選択して、必要な初期クラスターの数を入力し、[OK] をクリックします。

于 2015-08-03T06:48:47.510 に答える
0

元の作業が行われたシステムにアクセスできる場合は、ジャーナル ファイル (通常は statistics.jnl という名前で、[編集] > [オプション] > [ファイル] で指定した場所に保存されています) を探します。ジャーナリングが追加オプションで有効になっている場合、ユーザーが実行したすべてのコマンドが含まれます。

于 2015-05-22T13:09:41.693 に答える
0

プロジェクトに対して同じ一連の分析を行っています。参考までに、SPSS が提供する 2 段階のクラスタリング プロセスは、K-means よりも堅牢です (Punj & Stewart 1983)。K-means では、K をどのように選択しますか?! K-means の使用を主張する場合は、clvalid パッケージを使用して K の最適な数を取得することもできます。

Punj、G.、およびStewart、DW(1983)。マーケティング調査におけるクラスター分析: レビューとアプリケーションの提案。ジャーナル オブ マーケティング リサーチ、134-148。

于 2015-05-29T01:42:20.453 に答える