r - Traminer での複数のイベント

Question

複数の配列をTraMineRで一度に解析しようとしています。seqdef を見てきましたが、複数の変数を扱っているときに TraMineR データセットを作成する方法を理解するのに苦労しています。私は、Aassveらが使用したデータセットに似たものを扱っていると思います. （チュートリアルで述べたように）、各波にはいくつかの状態（子供、結婚、雇用など）に関する情報が含まれています。私の変数はすべてバイナリです。以下は、3 つの波 (D、W2、W3) と 3 つの変数を含むデータセットの例です。

D<-data.frame(ID=c(1:4),A1=c(1,1,1,0),B1=c(0,1,0,1),C1=c(0,0,0,1))
W2<-data.frame(A2=c(0,1,1,0),B2=c(1,1,0,1),C2=c(0,1,0,1))
W3<-data.frame(A3=c(0,1,1,0),B3=c(1,1,0,1),C3=c(0,1,0,1))
L<-data.frame(D,W2,W3)

私が間違っているかもしれませんが、私が見つけた資料は、一度に 1 つの変数のデータ管理と分析のみを扱っています (たとえば、いくつかの波にまたがる雇用状況)。私のデータセットは上記よりもはるかに大きいため、チュートリアルの 48 ページに示されているように、これらを手動で帰属させることはできません。TraMineR (または同様のパッケージ) を使用してこのタイプのデータを処理した人はいますか?

1) 上記のデータを TraMineR にどのようにフィードしますか?

2) どのように代替費用を計算し、それらをクラスター化しますか?

どうもありがとう

score 4 · Accepted Answer

シーケンス分析を使用する場合、1 つの変数の進化 (たとえば、複数の波にわたる 1 つの変数のシーケンス) に関心があります。次に、いくつかの変数を分析する複数の可能性があります。

変数ごとにシーケンスを作成し、シーケンスのクラスター間のリンクを分析します。私の意見では、変数が異なる概念 (たとえば、家族と雇用) を測定する場合、これが最善の方法です。
interaction関数を使用して、1 つの波のさまざまな変数である波ごとに新しい変数を作成しinteractionます。たとえば、ウェーブ 1 の場合、L$IntVar1 <- interaction(L$A1, L$B1, L$C1, drop=T)(drop=T未使用の回答の組み合わせを削除するために使用します) を使用します。次に、この新しく作成された変数のシーケンスを分析します。私の意見では、変数が同じ概念の異なる次元である場合、これが好ましい方法です。たとえば、結婚、子供、組合はすべて家族生活に関係しています。
変数ごとに 1 つのシーケンスオブジェクトを作成し、それを使用seqdistmcして距離を計算します (マルチチャネルシーケンス分析)。これは、代替コストをどのように設定するかに応じて、前の方法と同等です (以下を参照)。

2 番目の戦略を使用する場合、次の代替コストを使用できます。元の変数との差を数えて、代替コストを設定できます。たとえば、状態「既婚、子」と「未婚、子」の間では、「結婚」変数にのみ違いがあるため、置換を「1」に設定できます。同様に、すべての変数が異なるため、州「既婚、子供」と「未婚、子供なし」の間の代替コストを「2」に設定します。最後に、インデルコストを最大代替コストの半分に設定します。これはによって使用される戦略seqdistmcです。

お役に立てれば。

r - Traminer での複数のイベント

2 に答える 2

Related

Reference