問題タブ [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
panel-data - 時間固定効果(エラーメッセージ)
次の式を定義するRで固定効果回帰を実行したい:
time.aspects <- as.formula(y ~ x1 + x2 + x3 + t)
time.total <- plm(time.aspects, data=all, index=c("i","t"), model = "内部")
x1、x2、x3 は独立変数です。また、時間固定効果を説明するために、時間係数 t を追加したいと考えています。この点で、t は 1 年から 10 年 (私のデータ ファイルに含まれています) を表します。
ただし、次の方法でロバストな標準誤差を考慮したい場合:
coeftest( time.total , vcov. = vcovSCC( time.total , type = "HC3"))
次のエラーが発生します: 1 の間違い - diaghat : 二項演算子の引数が数値ではありません。
このエラーメッセージを回避する方法を知っている人はいますか?
r - R 内、間、または全体の R 二乗の計算
plm package
パネルモデルの計量経済学を行うために、Stata から R ( ) に移行しています。Stata では、変量効果などのパネル モデルは通常、内、間、および全体の R 二乗を報告します。
私はplm
、ランダム効果モデルで報告されたR 二乗が R 二乗内に対応することを発見しました。では、R を使用して R-squared 全体と R-squared を取得する方法はありますplm package
か?
R と Stata で同じ例を参照してください。
スタタで:
R で報告された R-sq (0.18062) は、少なくともこの場合、Stata で報告された R-sq Within (0.1799) に似ています。Stata で報告された (0.1860) と全体 (0.1830) の間の R 平方を R で取得する方法はありますか?
stata - 状態でのチョウテスト
2 つのパネル回帰があります。
また、b1=b2、c1=c2、d1=d2 かどうかをテストしたいのですが、Stata の事後評価テストの中に Chow テストが見つかりませんでした。手動で計算する必要があるようです。ただし、Chow テストの式には、xtreg
コマンド後に報告されない Residual SS が必要です。代わりにR-sq間またはR-sq内で使用できますか?
コマンドも考慮testparm
しましたが、それは最後の推定の係数のみを考慮しています。私の場合、それらは の係数ですb2, c2, d2
。では、方程式を特定して、異なる回帰の係数を比較する機会があるのではないでしょうか?
または、私が考慮していない他のオプションはありますか?
merge - 両方のデータセットで一意でない識別子に基づいてデータセットをマージする方法
Stata で 2 つのデータ セットをマージする場合、いずれかのデータ セットで一意でない 1 つの変数に基づいて、マージ x:x は有用なツールではないようです。望ましい結果をもたらす戦略は?
定型化された例:
データセット1
データセット2
標的:
直観: 一部の資産運用会社は複数の銀行に保有されている可能性がありますが、一部の銀行は複数の資産運用会社を所有しています。
r - PostgreSQL、R: テーブルのすべての行を乗算してパネル データ (時系列) を作成する
buildings
320 万行のテーブルがあります。(バランスの取れた) Paneldataとして処理するには、このテーブルを 11 の異なる期間に拡張する必要があります。これは、すべてのオブジェクトについて、11 の異なる年 (2000 年から 2010 年) を観察する必要があることを意味します。ピリオドは次のように呼ばれる必要があります。
テーブル定義
Rでの回帰分析にデータを使用したい。
ibase_id
の配列ですgid
。
ibase_dist
オブジェクトまでの距離を含む関連配列gid
です。2 つの配列の長さは常に同じです。
gid
配列内の は のレコードに属し、オブジェクトの中心buildings
から 500m の半径内にありcentroid
、かつ pv=TRUE です (これはdist
、instdate
、instp
、capac
&pvid
がであることを意味しますNOT NULL
)。
例:
ibase_id: {3075528,409073,322311,226643,833798,322344,226609}
;
ibase_dist {290,293,398,494,411,381,384}
各期間について、配列のエントリのみが考慮され、その年はパネル データの観測期間よりも前でした。(最初に配列を連結する必要があるため、上記のクエリはまだ機能しません)現在、2 つの配列はすべての年の情報を保持しています。そのため、各期間に追加する必要があると考えたので、パネルデータに展開した後、ibase
各レコード (11x 3,2 百万) を計算します。
回帰分析にすべての列は必要ありません。乗算のパフォーマンスが劇的に向上する場合は、行に固執することができます (基本的にはジオメトリ列を除外します)。
ソリューションアプローチ
periods
11 の異なる期間を含む 2 番目のテーブルを作成し、このテーブルに table を乗算するという基本的なアイデアがありましたbuildings
。これを実装する方法がわからない。残念ながら、私は R の経験があまりなく、R のデータベース インターフェイスをまだ使用していません。
Visual C++ ビルド 1800、64 ビットおよび R x64 3.2.1 でコンパイルされた PostgreSQL 9.5beta2 での作業
r - R で 2 つのベクトルのすべての組み合わせを作成しますか?
日付、州、および製品コードに従ってインデックス付けされた価格のデータフレームがあります。
ただし、一部のデータが欠落しています。日付、州、および製品コードのすべての可能な組み合わせのデータ ポイントが必要です。
(ちなみに、私の Date ベクトルは 200601 から 201212 までの整数です。)
私がこれを行う方法は、欠落している各価格について、最も近い日付で同じ州の同じ UPC の価格を取得することです。
状態 1 の製品 A の 200803 の価格が欠落しているとします。状態 1 の製品 A の価格を 200804、次に 200802、次に 200805 などを検索するアルゴリズムを作成したいと考えています。価格を見つけます。その州のその製品に価格がまったくない場合にのみ、NA が必要です。
誰もこれを行う方法を知っていますか? これを行うパッケージがあると思います。ありがとう。
stata - パネル データが 1 回値を取る場合に変数を定義する
id 変数で識別されるパネル データ セットと、期間ごと (毎週) に異なる値を持つ 1 つの特定の文字列変数があります。すべての ID が毎週表示されるわけではありません (新しい ID が出現し、古い ID が消える可能性があります)。
この変数に特定の用語が含まれている場合にダミーを作成しましたが、1 週間で 1 回の出現しかキャプチャしません。私が望むのは、各 id に特定のダミーがあり、その用語が少なくとも 1 週間の出現で文字列変数に含まれているかどうかを示すことです。したがって、第 34 週に id x に用語が含まれている場合、「1」を示す他のすべての週にもダミーが必要です。これは、用語が id x に含まれていたためです。
としてフォーマットしxtset
て viaF.
に置き換えようとしましたが、期待どおりに機能しませんでした。