問題タブ [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 繰り返し測定のためにデータフレームからすべての行をサブセット化する方法
私の質問の背景は次のとおりです。行ごとに1つのデータポイントの繰り返し測定で構成されるデータセットがあります。これらのデータは縦断研究からのものであるため、現時点ではすべての被験者がすべてのデータ ポイントを持っているわけではありません。
基準を満たすすべてのデータ ポイント、つまりすべての反復測定、または 2 つの反復測定を持つデータ ポイントを抽出できるようにしたいと考えています。
簡単な例を次に示します。
その結果:
そう:
- 被験者 0 と 1 には、ベースラインと 2 つの反復測定があります。
- 被験者 2 には、ベースライン測定値と 1 つの反復測定値があり、
- 被験者 3 にはベースライン メジャーしかありません。
すべてのデータが含まれている 2 つの繰り返し測定値 (または 1 つまたはベースラインのみ) を持つすべての被験者を選択的にサブセット化できるようにしたいと考えています。
この例を使用して、場所をサブセット化できます - visit == 2。しかし、2番目の訪問データポイントを持つ被験者について、訪問0と1のデータを抽出する方法もわかりません。概念的には、subject.id を知っていて、この情報を何らかの方法で使用できることがわかりますが、リストを使用してサブセット化する方法がわかりません。潜在的なヘルプの%in%演算子はここにありますか?
何かご意見は?前もって感謝します。
r - 個人ごとにパネルデータをサンプリング/パーティション化する方法(できればキャレットライブラリを使用)?
パネル データを分割し、データのパネルの性質を維持したいと思います。
ただし、データを分割またはサンプリングするときに、同じ人 (id) が 2 つのデータセットに分割されることを回避したいと思います。データからランダムにサンプリング/分割し、観察ではなく対応するパーティションに個人を割り当てる方法です。 ?
私はサンプリングしようとしました:
ただし、それはデータのパネルの性質を破壊します...
r - ユーザー提供の共分散行列を使用した F 統計の計算
以下の編集を参照してください
packageでは、 (ロバストな標準誤差の場合) 共分散行列を指定すると、表示される F 統計が変わらないplm
のはなぜだろうと思っていました。summary()
次のコードを考えてみますsummery()
。ただし、変更によって計算される F 統計量waldtest()
:
Stata のロバストな標準エラーに関するこの投稿を考慮し、F 統計の出力をロバストな標準エラーありとなしで比較すると、F 統計は変更する必要があるように感じます。
これは plm 1.4 (当時は安定版リリース) でした。
EDIT : pwaldtest
CRAN リリース 1.6-4plm
ではそれが行われ、現在組み込まれているsummary.plm
ため、次のいずれかを実行するだけで、調整された df2 パラメーターを使用して堅牢な F テストが得られます。
実践者向けのロバストな推論に関する参考資料として、Cameron/Miller 著「A Practitioner's Guide to Cluster-Robust Inference」、Journal of Human Resources、2015 年春、Vol.50、No.2、pp.317-373 があります。http://cameron.econ.ucdavis.edu/research/papers.html
r - R の plm パッケージを使用した gmm アプローチで一緒に属する複数の ID のグループ クラスター
Blundell Bond estimator を使用して gmm モデルを確立したので、個人をグループにクラスタリングしたいと思います。データセットには既に変数があります (例: 値 1 ~ 4)。目的は、このクラスターの観測されていない不均一性を捉えることです。
- pgmm関数でデータをクラスタ化することはできますか?
- コード関数にクラスターを追加するにはどうすればよいですか?
ここに私のデータがあります:
ここに私のコードがあります:
r - R - posix 形式の時間による plm 回帰
R でのパネル データの経験はほとんどなく、plm-package を使用して単純なパネル回帰を実行しようとしています。ただし、データフレームを pdata.frame に変換すると、時間インデックス変数が因子変数に変換されます。これは、従属変数を時間の関数として回帰したい場合、回帰は時間のダミー変数の長いリストを生成し、それぞれの個別の係数を計算することを意味します。時間単位あたりの平均効果(つまり、ポイントの月間平均増減)が欲しいだけです。
データフレームの例:
サンプルのデータフレーム構造が ID = int、Date = POSIXct、Points = int であるとします。次に、インデックス ID と日付を使用して pdata.frame に変換します。
そして、plm 固定効果回帰を実行します。
結果の係数は、ダミーとして月ごとに分類されます。時間変数を連続変数として扱いたいので、日付の係数は 1 つだけ取得します。これどうやってするの?パネル データフレームの要素として時間インデックス変数をフォーマットしないようにする方法はありますか?
r - パネル モデルとプールされた OLS (自己相関のダービン ワトソン テスト) の p 値 (および統計値) が間違っている plm からの pdwtest?
およびのダービン ワトソン テスト (それぞれおよび) と比較して、なぜpdwtest()
非常に異なる p 値を出力するのか疑問に思いました。以下の違いのドキュメントを見つけてください。その後、plm のソースから取得したコードを提供し、問題の修正を試みました。誰かがそれを見てもらえますか?それでも p 値は一致しませんが、非常に近い値です。それは数値精度によるものだと思いますか?また、ランダム効果モデルの p 値については完全にはわかりませんが、これは統計上の問題であり、プログラミングの問題ではありません (検定のために切片を残しますか?)。lmtest
car
dwtest()
dwt()
pdwtest()
EDIT 2019-01-04 : Bhargava らの一般化されたダービン・ワトソン統計。(1982) および Baltagi/Wu の LBI 統計は現在、plm の最新バージョン (1.7-0) で として実装されていpbnftest()
ます。
ここで起こっていることを区別する必要があると思います:
1) p 値: 追加の切片が lmtest::dwtest() に渡されるため、p 値はずれているようです。私の推測では、これは自由度の間違った計算につながり、したがって疑わしい p 値につながります。
以下の文書とhttp://www.stata.com/manuals14/xtxtregar.pdfを参照してください。
Bhargava, Franzini, Narendranathan, Serial Correlation and the Fixed Effects Model, Review of Economic Studies (1982), XLIX, pp. 533-549
バルタギ、BH、PX ウー。1999. AR(1) 乱れを伴う不等間隔のパネル データ回帰。計量経済理論 15、pp 814–823。
バージョン: R 3.1.3 plm_1.4-0 lmtest_0.9-34