問題タブ [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - パネル データ R の多重共線性のテスト
plm
のパッケージを使用してパネル データ回帰を実行しておりR
、説明変数間の多重共線性を制御したいと考えています。-パッケージに機能
があることは知っていますが、私が知る限り、パネルデータの出力を処理することはできません。
は単位根検定などの他の診断を行うことができますが、多重共線性を計算する方法は見つかりませんでした。
同様のテストを計算する方法はありますか、または各変数を時系列と見なして、パネル情報を除外し、パッケージを使用してテストを実行できますか?
データを開示することはできませんが、問題はすべてのパネル データ モデルに関連しているはずです。
ディメンションは、50 の期間にわたる約 1,000 の観測値です。vif()
car
plm
vif
car
私が使用するコードは次のようになります。
その後
エラーを返します。
前もって感謝します。
r - アンバランスパネルデータからのRサンプル
ユニットごとの観測数の違いによって偏りのないランダムなサンプルを抽出したい、バランスの取れていないパネル データを使用しています。たとえば、以下のコードでは、IBM は GOOG の 2 倍、MSFT の 5 倍、選択される可能性が高くなります。各企業/年が選択される確率が等しいかのように、このデータをサンプリングする方法はありますか? おそらくサンプリングパッケージを使用して?
r - 伝記データをパネル データに変換する
1600人以上の伝記データがあります。性別、生年月日、出身地などのほか、入社年からの経歴などもデータ化。これをパネルデータにして、彼らが就職してからの職場の変化を把握しようとしています。このデータセットには次の問題があります。
1) これをパネル データセットに変換するにはどうすればよいですか? 各 person(id) に必要な最適な形式は次のとおりです。
2) その人物の位置が重複している場合、どのように情報を保存しますか? たとえば、ジョブ 3 とジョブ 5 を同時に持つことができます。あとは上位の仕事だけを利用したいと思っていますが、それまではできるだけ多くの情報を保存したいと思っています。
r - Rのパネルデータのように見えるようにxtsデータをソートする
R の「PerformanceAnalytics」パッケージを使用する必要があり、このパッケージを使用するには、データを xts データに変換する必要があります。データは次のリンクからダウンロードできます: https://drive.google.com/file/d/0B8usDJAPeV85elBmWXFwaXB4WUE/edit?usp=sharing . したがって、次のコマンドを使用して xts データを作成しました。
しかし、これを行うと、パネルのデータ構造が失われます。データを並べ替えてxts
パネル データ形式に戻そうとしましたが、失敗しました。
xts
パネルデータのようにデータを再編成するのを手伝ってくれませんか。会社 ID (gvkey) とデータ (datadate) で並べ替える必要があります。
dataset - データをマージしてパネルを形成する方法は?
2 つのデータ フレームがあります。データフレーム「天気」は次のようになります。
そして、データフレーム「規則性」は次のようになります。
フォームの R でパネル データフレームを作成したい:
merge と reshape2 を試しましたが、無駄でした。どんな助けにもとても感謝します。ありがとうございました。
r - Rでの時系列データの再形成
IMF IFS からの四半期ごとの時系列の経済データを持っているので、長い形式にする必要があります。
現在、行は国ごとの変数で、列は時間なので、このようになります。
私はそれを長い形式にする必要があります:
ID 変数と測定変数が両方とも行にある場合、reshape の使用に関するアドバイスを見つけることができませんでした。
r - 時間依存のパネル データから一連の数字を作成する
だから私は学生がクラスにいた年と彼らがいた年の何四半期のデータセットを持っているので、2002年は4回で、以下のように四半期1、2、3、4があります:
これは私にこれを与えます
四半期の数を累積する新しい変数を作成するシーケンスを生成したいのですが、必要に応じて年と四半期をマージするのは難しくありませんが、次のようなシーケンスを行うように指示するにはどうすればよいですか
私にこれをくれ
私はrepコマンドとシーケンスなどを試しましたが、各参加者の後に番号付けを再開するように指示する方法がわかりません. クォーターの数は学生によって異なり、どのクォーターで開始するかを知る必要はありません。これは大学のデータなので、クォーター 2 から開始できると思います (すべての開始値に関するデータ セット全体を調べていません)。参加者は 6,000 人程度) でも、累積する必要があるだけです。この質問が適切であることを願っています。質問を正しくフォーマットしました。
r - NA を使用した PLM モデルのパディング値
次のデータセットがあります
NA
一部の変数に s が含まれています。パッケージを使用してplm
、次のモデルを推定します。
ここで、適合値を抽出したいと思います。私が理解しているように、これを行う最善の方法は、応答変数から残差を減算することですvar1
(適合値を取得する関数がないためpml
(ここを参照):
ただし、s の行は除外されますNA
。NA
元のデータセットに s がある場合に、適合値に s を追加したいと思いますNA
。NA
s から適合値までのパッドを保持するスマートで簡単な方法があるはずdt
ですが、私にはわかりません。どんな助けでも大歓迎です!