問題タブ [panel-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - パネル データの動的タイム ワーピング (dtw)
次のデータ フレームでは、次のコードを使用してコスト マトリックスを計算しました。最初に、[i,j] エントリがすべて 10 の行列を作成しました。次に、距離を計算するために dtw 関数を使用して下三角部分を埋めました。
「distmx」マトリックスの上三角部分を空白にする方法を教えてください。つまり、マトリックス「distmx」の上三角部分の10を削除したいということです。
このようなデータ セット (パネル データ セット) の場合、クエリと参照シリーズを選択してプロットするにはどうすればよいですか?
コスト マトリックス
r - 変数がRの特定の文字列と等しい場合の条件付きプロット
次の形式のような時系列パネル データセットがあります。ここで、V1 は文字 (ここでは A、B、C...) で、V2 は数値 (5,8,6...) です。V1 には 65 の異なるアイテムがあります (合計約 50000 の奇妙な観測値)。V1=A または B などの条件で V2 をプロットする方法を見つけようとしています。私が簡単にできることはplot(V1[1:1065])
、plot([V1:1066:2085])
などですが、これを行うための堅牢な方法を探していました。次のようなことを試しました:
しかし、R の 'if' はベクトルを受け入れないため、エラー メッセージが表示されます。"the condition has length > 1 and only the first element will be used"
誰でも何か提案してもらえますか?
r - 時不変変数を使用した R の PLM
45 年間にわたって収集された米国の各州の観察結果を含むパネル データを分析しようとしています。時間の経過とともに変化する 2 つの予測変数 (A、B) と、変化しない 1 つの予測変数 (C) があります。私は、従属変数 Y に対する C の効果を知り、A と B を制御し、状態と時間の違いを制御することに特に関心があります。
これは私が持っているモデルで、R で plm パッケージを使用しています。
私の推論は、時不変変数では、固定効果モデルではなくランダムを使用する必要があるということです。私の質問は、私のモデルと考え方は正しいですか?
よろしくお願いいたします。
regression - 3 つのファイルを結合してパネル データを作成するにはどうすればよいですか?
3 つの異なる Stata ファイル (それぞれ 3 つの異なる年) があり、固定効果の回帰を推定したいと考えています。回帰をテストするには、これらのファイルをマージする必要があると思いますが、どうすればよいですか? これらの各ファイルで同じ変数の時間を識別するにはどうすればよいですか?
r - 定義された連続観測数に基づいて、R 条件付きパネル データの変数をドロップします
私はRを初めて使用します。私の問題は次のとおりです。
このような時系列として編成された一連のパネル データがあります (一部のみが表示されます)。
たとえばチーム B を使用するのは、観測の欠落が多すぎるため意味がありません。ランキング システムは、40 未満のランキングのデータを提供しません。そのため、少なくとも 8 週間の連続観測がない列 (変数) を削除して、クリーンアップしたいと考えています (この例では、チーム A、B、D など)。したがって、D は 2010 年 2 月 20 日から始まる週にギャップがあるため、要件を満たしていません。1000以上の列を取得したことに注意してください。
以前にこれを試しましたが、必要なものが得られず、残念ながら、必要に応じてコードを変更するスキルがありません。
私が考えることができるいくつかの可能な解決策:
8 つ以上の連続した観測値を持つ各変数の部分をサブセット化する
観測値 = NA を設定 8 個の obs の連続実行に NA が含まれる場合、NA のみを持つ列を削除します。これは、最小 8 週間の要件を満たさない列には NA 値しか含まれないためです (意味が理解できると思います)。
興味深いことに、データが長い形式で編成されている場合、同じことを行うのはより難しくなりますか?
助言がありますか?
r - パネル データのプールされた回帰モデルのモデル予測
毎年(前の年に基づいて)複数のプールされた回帰を実行した予測モデルを作成しようとしているため、係数が時間とともに変化します。(これは提供されたサンプル データでは意味がないかもしれませんが、私のサンプルでは実際に行われています)。
これが私がこれまでに思いついたことです: 私は自分のコードを plm パッケージからの再現可能なサンプルに調整しました:
データは次のように構成されています (パネル)。企業、年が索引付けされています。
ここに私のコードがあります:
残念ながら、私のコードは機能せず、次のエラーが発生します。
理想的には、元の Grunfeld データと同じ構造の $Grunfeld$Forecast に予測/予測を保存したいと考えています。しかし、私はリストの操作に多くの困難を経験し、それらを正しくアドレス指定して元のデータの隣のベクトルに結果を格納することに失敗することがよくありました。これは、私自身のサンプルでは非常に重要です。多くの欠損データ (NA) があり、限られたサブセットでのみ予測関数を使用できます。データを望ましい方法でどのように配置しますか?
そして、これは、勾配を変化させて元のデータと同じ方法でそれらを保存する条件付き予測(年)を取得するための正しいアプローチですか、それとも私が知らないより効率的な方法はありますか?