5

最適なマッチング アルゴリズムを使用して、TraMineR でシーケンス分析を行っています。残念ながら、右打ち切りデータのため、シーケンスの長さが等しくありません。私のシーケンスの最小の長さは 5、最大の長さは 11 です。長さの変化は、関心のあるシーケンス間の非類似性には意味がありません。したがって、シーケンス間の全体的な非類似性に対する不等長の影響を次のように保持したいと考えています。できるだけ小さく。

Stovel と Bolan (2004 (1)) で、この問題の可能な解決策を読みました。彼は、シーケンスの長さが等しいかどうかに応じて可変インデル コストを使用しています。そのため、長さが等しいシーケンスには固定インデル コストを使用し、長さが等しくないシーケンスには、「固定コストの約 4 分の 1」の削減コストを使用します。

私の質問は次のとおり です。一般に、欠落は TraMineR でどのようにコーディングされるべきですか? 空要素として、または不足している状態をアルファベットに含める必要がありますか? Stovel と Bolan によって導入されたように、TraMineR に可変インデル コストを適用するオプションはありますか? はいの場合、どうすればこれを行うことができますか?


(1) ストーベル、キャサリン、マーク・ボラン。2004年。社会学的方法と研究 32(4):559-598。

4

1 に答える 1