「このモデルを R で実行するにはどうすればよいですか」という質問をお詫びします。統計モデルに関しては、私が初心者であることを最初に認めます。うまくいけば、それを取り巻く興味深い質問が十分にあり、質問は「Rのこのコマンドはこの統計モデルに対応していますか?」のようなものになるでしょう。
特定の Twitter ユーザーが特定の政党の政治ユーザーを「フォロー」する確率を推定できるモデルを推定しようとしています。私のデータフレームは個々のユーザーのレベルにあり、各ユーザーは Twitter でパーティーをフォローするかどうかを選択できます。代替固有の変数として、Twitter ユーザーと政党からのイデオロギー的距離の尺度と、距離が正か負かを指定する相互作用項があります。したがって、ツイッターで政治家をフォローするという決定は、あなたのイデオロギー的距離の機能です。
最初は条件付きロジットモデルを推定しようとしましたが、選択肢が相互に排他的ではないため、つまり複数の当事者に従うことを選択できるため、すぐにその考えから離れました。モデルで個人が複数の選択肢を選択できるようにしたいので、今、多項プロビットと多変量プロビットのどちらを採用すべきか疑問に思っています。ただし、多項プロビットを推定しようとすると、コードが機能しません。私のコードは次のとおりです。
mprobit <- mlogit(Follow ~ F1_Distance+F2_Distance+F1_Distance*F1_interaction+F2_Distance*F2_interaction+strata(id),
long, probit = T, seed = 123)
そして、次のエラーメッセージが表示されます。
Error in dfidx::dfidx(data = data, dfa$idx, drop.index = dfa$drop.index, :
the two indexes don't define unique observations
エラーを調べてみましたが、プロビット モデルに関連するものが見つからないようです。私が間違っていることを教えてもらえますか?繰り返しますが、私の無知で申し訳ありません。ご協力ありがとうございました。
また、以下のコードでデータフレームをコピーしようとしました。データは、最初の Twitter ユーザーの最初の 6 回の観測に関するものですが、デンマークには 10 の団体があるため、51810 の観測に対応する 5181 人のユーザーのデータセットがあります。
id Alternative Follow F1_Distance F2_Distance F1_interaction
1 1 alternativet 1 -0.9672566 -1.3101138 0
2 1 danskfolkeparti 0 0.6038972 1.3799961 1
3 1 konservative 1 1.0759252 0.8665096 1
4 1 enhedslisten 0 -1.0831657 -1.0815424 0
5 1 liberalalliance 0 1.5389934 0.8470291 1
6 1 nyeborgerlige 1 1.4139934 0.9898862 1
F2_interaction
1 0
2 1
3 1
4 0
5 1
6 1
>```